在EMR中使用snappy压缩的时候快速查看压缩前文本的内容

在EMR的项目中,按理阿里云目前提供的解决方案,大多数的同学可能都是使用的logtail做的日志收集,然后通过logshipper投递到oss中存储。这么配置以后,存储在oss里面的文件都是snappy格式了,但是怎么使用估计大部分同学是一脸懵逼的。

有两个小的配置,可以方便的和使用gzip一样使用snappy文件。

1 hadoop fs -text的命令直接查看。如果是直接使用的话,你看到的都是二进制,直接把shell搞死。需要用下面的格式查看

    hadoop fs -Dio.compression.codec.snappy.native=true -text oss://xxx/xx.snappy

2使用MR脚本的时候,需要配置下,这个可能大部分同学都会,因为之前使用gzip的时候,也需要添加类似的配置项才能跑起来

    hadoop ....... -jobconf io.compression.codec.snappy.native=true

时间: 2024-09-25 04:10:31

在EMR中使用snappy压缩的时候快速查看压缩前文本的内容的相关文章

pb 压缩 多个文件-pb中如何将一个文件夹和一个文件压缩到一个zip压缩文件中

问题描述 pb中如何将一个文件夹和一个文件压缩到一个zip压缩文件中 在pb中如何将一个文件夹和一个文件压缩到一个zip压缩文件中,不要rar的,求高手 解决方案 可以用zlib来实现,参考以下链接 http://download.csdn.net/detail/distancehalf/3032693 或者调用winzip的命令行,通过run命令来实现

360压缩如何进行固实压缩,什么是固实压缩?

  固实压缩是一种特殊的压缩存储格式,固实压缩把要压缩的全部文件当做一个连续的数据流来处理.通俗的可以这样认为:普通压缩是把一个文件一个文件分别压缩然后合成压缩包,固实压缩是先把这些文件连接起来当做一个大文件进行压缩.这样的优点是在压缩超大量小体积文件时压缩率更高,压缩后的文件体积更小.但是也有缺点就是即使只打开其中的一个小文件,也需要解压完整个压缩包.在实际使用时,只要你需要最小体积的压缩,尽量采用7z的固实压缩,这个缺点实际影响很小.目前360压缩右键菜单中的"添加到***.7z"

文件快速加密压缩备份到u盘的技巧

  小编这里要跟大家分享的是关于文件快速加密压缩备份到u盘的技巧,u盘是我们拷贝文件时常用的工具,方便携带,在平时的工作中,我们经常需要将一些重要的文件备份到u盘里,但是又怕别人借用u盘的时候看到我们的重要文件,因此我们还会对u盘进行加密,一般大家都会选择利用WinRAR等工具手工将所需的文件制作成压缩包,然后将其移动到优盘上.这样的操作显得比较繁杂,实际上,利用Windows操作系统的"发送到"菜单,就可以实现更加快捷的加密压缩操作.感兴趣的朋友一起来看看吧! 操作方法: 1.首先在

怎么用c#写一个解压指定目录下所有的压缩文件,并且把压缩文件里面的内容放进指定文件夹呢?

问题描述 怎么用c#写一个解压指定目录下所有的压缩文件,并且把压缩文件里面的内容放进指定文件夹呢? 怎么用c#写一个解压指定目录下所有的压缩文件,并且把压缩文件里面的内容放进指定文件夹呢? 解决方案 http://www.cnblogs.com/zfanlong1314/p/4202695.html 解决方案二: csharp文件操作类 遍历 递归 着重这三点 解决方案三: 放进文件夹就是先创建一个和压缩文件同名的目录,然后作为解压目录. 解决方案四: 这个问题,可以分成几部分:1 遍历指定目录

ASP.NET页面进行GZIP压缩优化的几款压缩模块的使用简介及应用测试!(附源码)第1/2页_实用技巧

在介绍之前,先简单说一说ASP.NET服务端GZIP压缩模块的作用及工作原理,很多人编写网页的时候页面因为使用了大量的JS特效又或者放置很多大型动态广告导致了页面或脚本体积庞大,通常都会使用一些压缩工具本地对页面或脚本进行一定的压缩后再上传到服务器,但这样的压缩工具一般压缩率有限,优化自然也不明显,本文章介绍的压缩模块的作用就是对asp.net的页面或脚本等资源进行高强度GZIP压缩(一般能压缩到只有1/5的体积),而且压缩的过程是发生在客户端请求aspx页面的时候由服务端进行压缩处理后再传送给

新人求助GZIP压缩的问题,C#压缩的结果与C不一样。

问题描述 在C#中使用GzipStream压缩一个文件,用C调用zlib官网的的库压缩同一个文件,得到的结果不一样.原文件5M多一点,C#压缩出来972k,C压缩出来702k.两压缩的文件的头尾8个字节是一样的.下面是主要代码:C#:publicbyte[]gZipCompress(byte[]input){using(MemoryStreamms=newMemoryStream()){using(GZipStreamgZipStream=newGZipStream(ms,Compression

php压缩HTML函数轻松实现压缩html/js/Css及注意事项_php技巧

压缩HTML的起因 如何提高网页加载速度 ,需要怎么对html页面优化相信是每个拟提高建站技术站长曾想到的问题,其实网页优化的方法还是很多. 有童鞋询问higrid如何 压缩HTML,也就是说能不能 把所有的html.js.Css在运行前都压缩成一行,清除注释标记.换行符.空格.制表符等.这样一个直接的好处是 减小html页面体积来提高前端加载速度.很多人认为启动gzip,但一般启动gzip都比较少对html启动gzip压缩,因为现在的html都是动态的,不会使用浏览器缓存,而启用gzip的话每

WORD中的邮件合并功能来快速制作通知书

  WORD中的邮件合并功能来快速制作通知书            1.首先建立一个excel表:a.xlsx 2.建一个word模板b.docx 3.邮件-开始邮件合并-信函 4.选择联系人-使用现有列表 5.选择需要引用的EXCEL a.xlsx 6.默认确定 7.将光标放置同学前 点插入合并域-姓名,此类推插入编号.学院.专业 8.效果如下 9.点击阅览结果 效果如下图

js实现文本框中输入文字页面中div层同步获取文本框内容的方法

 这篇文章主要介绍了js实现文本框中输入文字页面中div层同步获取文本框内容的方法,实例分析了javascript操作dom元素的技巧,需要的朋友可以参考下     本文实例讲述了js实现文本框中输入文字页面中div层同步获取文本框内容的方法.分享给大家供大家参考.具体实现方法如下:   代码如下: <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/x