Impala实践之十一:parquet性能测试
来源:互联网 发布:mac 卸载python idle 编辑:程序博客网 时间:2024/05/21 18:40
前言
之前一直考虑更换impala的文件存储格式为parquet,但是没有立即使用,最近又做了一些测试,看看parquet是否真的有用。在测试的时候顺便测了一下compute语句的效果,一起作为参考。下面抽出一个小业务的部分测试结果来展示。
测试准备
库名和表名当然不是真的。
测试范围:
- 文件格式:parquet和text
- compute语句的影响
测试用表:
测试用例1
这个记录是当时随手测的一个结果。
sql语句:
select count(*) from c;
测试结果:
测试用例2
sql语句:
select count(uid) from cwhere ***
测试结果:
测试用例3
sql语句:
dev表是另外一个表,不是parquet格式。
SELECT SUBSTR(a1.dt,1,7) dt, COUNT(DISTINCT a1.uid)FROM (SELECT userid uid , createtime dtFROM dev) a1LEFT JOIN (SELECT uid, dtFROM (SELECT userid uid, time dt FROM a_inUNION ALLSELECT uid uid, stime dt FROM ainWHERE atype='1'UNION ALLSELECT uid, time dtFROM cWHERE state!=0 AND source='test') a1 ) a2ON a1.uid = a2.uid AND SUBSTR(a1.dt,1,7)>SUBSTR(a2.dt,1,7)LEFT JOIN (SELECT uid, dtFROM (SELECT userid uid, time dt FROM inUNION ALLSELECT uid, time dt FROM cWHERE state!=0 AND source='pc') a1 ) a3ON a1.uid = a3.uid AND SUBSTR(a1.dt,1,7)>SUBSTR(a3.dt,1,7)WHERE a2.uid IS NULL AND a3.uid IS NOT NULLGROUP BY dtORDER BY dt;
测试结果:
测试用例4
这个稍微复杂一些,用到了上面的三张表,有一些join操作。因为前段时间发现了compute语句的神奇,因此这次顺便带上它。
sql语句:
select SUBSTR(a1.dt,1,7) dt, COUNT(DISTINCT a1.uid)FROM (SELECT uid, createtime dtFROM cWHERE state!=0 AND source='app') a1INNER JOIN (SELECT uid, dtFROM (SELECT userid uid, logtime dt FROM a_inUNION ALLSELECT uid uid, stime dt FROM ainWHERE atype='1') a1 ) a2ON a1.uid = a2.uid AND SUBSTR(a1.dt,1,7) = SUBSTR(a2.dt,1,7)GROUP BY dtORDER BY dt
测试结果:
2016-04-27 14:55:00 hzct
0 0
- Impala实践之十一:parquet性能测试
- Impala实践之十二:impala压缩方式测试
- parquet性能测试
- IMPALA性能测试
- Parquet表在spark与Impala间兼容性测试
- Impala Parquet 表 分区表
- Impala实践之十五:Impala使用文档
- Hadoop-impala十大优化之(2)—impala连接查询性能优化及最佳实践
- Impala 表使用 Parquet 文件格式
- Impala实践之十三:Impala建表时的关键字
- impala presto SparkSql性能测试对比
- Impala、Hive性能简单对比测试
- [译]性能测试最佳实践之JMeter
- Impala实践之二:Hive元数据
- Impala实践之三:详解invalidate metadata
- Impala实践之六:使用Rest Api
- Impala实践之七:添加负载均衡
- RC ORC Parquet 格式比较和性能测试
- 最短路-四种算法复杂度分析比较 HDU-1874 畅通工程
- Linux文件系统基础
- 【BFS】HDU 1495
- Qt4 串口第一次打开问题
- assets文件夹下的压缩包解压到sd卡功能实现
- Impala实践之十一:parquet性能测试
- window下查看网页保存的密码
- 计算机视觉与图形图像会议、学派的一点八卦和资料
- spring bean的作用域
- Impala实践之十二:impala压缩方式测试
- Impala实践之十三:Impala建表时的关键字
- centos 7 安装音频视频解码器
- Java变量类型
- hdu5863 cjj's string game