RCFile SequenceFile and Avro comparison Test
来源:互联网 发布:小米5x网络制式 编辑:程序博客网 时间:2024/06/05 19:41
Hive原始文件1421M,按snappy压缩之后结果:
select count(*) from table
select count(*) from (select key from table where key='') a;
file type
table name
row number
Map个数
File Size(M)
count(*) (S)
count(key) (S)
HDFS Read
text
test_text2
58336344
7
852.2
29.8
29.9
852.2
sequence
test_sequence
58336344
4
906.1
42.6
41.9
916.4
rcfile
test_rc
58336344
4
826.8
34
34.4
754.3
avro
test_avro2
58336344
3
590.9
75.8
90.7
591
Hadoop Cluster Network Usage:
Hadoop Cluster CPU Usage:
结论:
- RCFile在读速度是最高的。
- AVRO File最占用CPU。
- RCFile HDFS read在输入一样的情况下会比较低。
AVRO file hive表不支持增加列(例子:alter table test_avro add columns(x int)),其他都是支持的。
- AVRO压缩效果最好(压缩使用的CPU最多)。
- RCFile SequenceFile and Avro comparison Test
- hive sequencefile 和rcfile 效率对比
- hive sequencefile 和rcfile 效率对比
- impala表使用rcfile,sequencefile和parquet
- hive存储格式sequencefile和rcfile的对比
- hive存储格式sequencefile和rcfile的对比
- TACACS+ and RADIUS Comparison
- Java and C# Comparison
- Java and C# Comparison
- Java and C# Comparison
- AS3 and Haxe Comparison
- rcfile
- RcFile
- SequenceFile
- SequenceFile
- sequencefile
- Hadoop中数据序列化的常用方式:SequenceFile, Avro, Thrift, ProtoBuff -- 待完善
- VB.NET and C# Comparison
- cmd /c和cmd /k
- HIVE 数据倾斜调优总结
- 【Android 的视频编码 H263 MP4V H264】的代码实现
- Spring事务配置的五种方法(二)
- JavaScript 跨域访问的问题和解决过程
- RCFile SequenceFile and Avro comparison Test
- SQL server 中 varchar, nvarchar 字段,字符串带有尾随空白字符导致查询不到记录
- cocos2d-x项目移植到ios下加入开场动画
- ldr与adr指令、相对地址与绝对地址的理解
- android犯错日记6
- Web程序导出Excel文档
- 黑马程序员---网络编程
- C#中byte数组与结构体之间的转换
- ThinkPHP函数详解:import方法