Hivesql里的limit使用误区
来源:互联网 发布:java中的多态是什么 编辑:程序博客网 时间:2024/06/06 01:23
select * from HIVE_D_MT_UU_H_SPARK limit 1000;
读取前1000行。
需求:
在hive表前1000行里,过滤出不重复的refid,imsi。
错误的写法:
select distinct refid,imsi from HIVE_D_MT_UU_H_SPARK limit 1000;
会去读取全表,把0~1000行的不重复refid,imsi显示出来。
正确的写法:
select distinct refid,imsi from (select * from HIVE_D_MT_UU_H_SPARK limit 1000);
调优的写法:
CREATE TABLE TEMP_HIVE_D_MT_UU_H_SPARK AS
select * from HIVE_D_MT_UU_H_SPARK limit 1000;
select distinct refid,imsi fromTEMP_HIVE_D_MT_UU_H_SPARK;
hive最快的执行就是不走MapReduce。简单的select的是最快的,嵌套啥的都比较忙。与关系型数据库不同。
调优的写法执行更快。
阅读全文
0 0
- Hivesql里的limit使用误区
- HiveSQL的CASE-WHEN的使用
- HIVESQL中row_number使用
- sql里limit的用法
- android里的线程误区
- HiveSQL的编译过程
- hiveSql的一些问题
- mybatis limit的使用
- sqlite的limit使用
- mysql limit 的使用
- sql语句里的limit使用方法
- sql语句里的limit使用方法
- sql语句里的limit使用方法
- sql语句里的limit使用方法
- sql语句里的limit使用方法
- SQL语句里的limit使用方法
- auto_ptr的使用误区
- 指针的使用误区
- 探究Python生成随机字符串
- B树简单理解
- 剑指offer 反转链表
- Android实现简易联网交互
- jndi
- Hivesql里的limit使用误区
- 关于Oracle检索字段值小数点前面0不显示问题
- android 自定义view绘制流程
- Nginx配置和启动
- 在macOS上使用Python+MySQL连接Tushare,进行股票数据下载
- 瑟瑟发抖……
- 使用vim并预览markdown
- python---学习笔记之append()
- 插入排序的简单认识。