Hive 中一些特殊的HSQL
来源:互联网 发布:php接收不到ajax传值 编辑:程序博客网 时间:2024/06/05 04:03
1、导入数据时,指定分隔符
CREATE TABLE new_table_name row format delimited fields terminated by '\t' stored by textfileas select id,name from table_name;
2、当创建了一个bucket的表时,导入数据的方式:
set hive.enforce.bucketing = true;//这个让程序自动分配reduce的数量从而适配相关的bucket
insert overwrite table ext_login_bucket partition(dt='2013-12-01')select uid,ips from ext_login where dt='2013-12-27';注意上面的语句中,一定需要指定 dt='xxx'条件,不然的话,会出现一个空指针的异常:(message:partition values=[2013-12-01])
还有一点,插入语句的overwrite并不是可选的,是必填的,我经常忘记
同时,我们知道,加载数据还有一种方式,叫 load data ,这种方式也能导入成功,但是它不会按你设置的bucket个数将原文件拆分,这点需要了解一下。
3、查看bucket的 tablesample数据
select * from ext_login tablesample(bucket 1 out of 2 on id);
tablesample是抽样语句,语法:TABLESAMPLE(BUCKET x OUT OF y);其中y必须是table总bucket数的倍数或者因子。hive根据y的大小,决定抽样的比例。
比如:table总共分了64份,当Y=32时,抽取(64/32=)2个bucket的数据;当y=128时,抽取(64/128=)1/2个bucket数据。x表示从哪个bucket开始抽取。例如,table总bucket数为32,tablesample(bucket 3 out of 16),表示总共抽取 (32/16=)2个bucket的数据,分别为第3个和第(3+16=)19个bucket的数据
4、未完。。
0 0
- Hive 中一些特殊的HSQL
- python连接 hive 执行hsql
- 关于SHELL中一些特殊的$打头的特殊变量
- CSS 中 Display 的一些特殊属性
- URL中一些字符的特殊含义
- SQLServer2005中一些特殊的SQL命令
- URL中一些字符的特殊含义
- shell中一些特殊变量的涵义
- HTML中一些漂亮的特殊字符
- MATLAB中一些特殊的函数
- Android中GridView的一些特殊属性
- DispatcherServlet中一些特殊的Bean总结
- python类中一些特殊的方法
- xml中一些特殊字符的表示
- Android中GridView的一些特殊属性
- 转载hive中partition的一些知识
- hive使用中踩的一些坑
- Hive hsql使用注意事项和限制
- adb devices :???????????? no permissions 方法
- IIS应用地址池监控
- Android 中的各个Image
- SDN(软件定义网络)
- ArcSDE数据被锁定的解决方法
- Hive 中一些特殊的HSQL
- 基于Linux+kermit+cutecom下载u-boot到芯片里面去
- ExtJs 关于滚动条的处理
- HashMap的工作原理
- Android SDK的安装教程
- XShell 4使用sftp上传下载文件命令
- IOS开发---菜鸟学习之路--(二十二)-近期感想以及我的IOS学习之路
- GCC执行过程简介
- Cocos2d-x中用C++获取当前系统时间,实现跨平台