MR 代码优化及Hive优化(Hive中的存储格式与压缩格式)
来源:互联网 发布:淘宝售假怎么投诉 编辑:程序博客网 时间:2024/05/21 03:27
请百度:MapReduce的压缩优化,看看别人的博客!如:
http://www.cnblogs.com/end/archive/2013/01/15/2861448.html(非常不错!)--------》Hive优化
http://blog.csdn.net/ruidongliu/article/details/11690025---------------------------------------》MapReduce优化!
http://blog.csdn.net/wisgood/article/details/8789906---------------------------------------》MapReduce优化!
http://blog.csdn.net/erli11/article/details/40396257
http://www.cnblogs.com/zhengrunjian/p/4527269.html
在实际的项目开发当中,hive表的数据:
存储格式:(RCfile或者Parquet,推荐使用RCfile格式)
数据的压缩算法:snappy!
一、存储格式hive默认支持三种从存储格式,当然用户根据需要可以自定义存储格式。
需要一个合并文件的过程,
且合并后的文件将不方便查看TEXTFILE
简单
方便查看RCFILE
按列查找,理论上对于宽表采用这个比较好
比较新,还没有广泛应用
二、压缩格式
压缩格式工具算法文件扩展名多文件可分割性DEFLATE*无DEFLATE.deflate不不GzipgzipDEFLATE.gz不不ZIPzipDEFLATE.zip是是,在文件范围内bzip2bzip2bzip2.bz2不是LZOlzopLZO.lzo不不snappy
0 0
- MR 代码优化及Hive优化(Hive中的存储格式与压缩格式)
- Hive优化--文件压缩格式
- hive中的支持的存储格式和压缩格式
- Hive中压缩设置 和 Hive文件存储格式及使用
- Hive 文件压缩存储格式(STORED AS)
- Hive压缩格式
- HIVE 之压缩格式
- hive压缩格式
- Hive-Snappy压缩格式设置与规范
- hive文件存储格式
- hive文件存储格式
- hive文件存储格式
- hive文件存储格式
- HIVE 文件存储格式
- hive文件存储格式
- HIVE文件存储格式
- hive文件存储格式
- hive文件存储格式
- ajax
- noi题库—搜索—分成互质组
- Argparse简易教程[转载]
- 23种设计模式
- shiro收获
- MR 代码优化及Hive优化(Hive中的存储格式与压缩格式)
- Java GC 源码分析(1)
- Effective Java 2.0_中英文对照_Item 5
- python1
- 18. 4Sum (Runtime Error)
- Tomcat安装及环境变量配置二
- poj1191 棋盘分割
- iOS新手调试
- win7 64位系统安装jupyter