Hive创建外部表以及分区
来源:互联网 发布:按键精灵调用js 编辑:程序博客网 时间:2024/05/02 04:45
创建带分区的外部表
创建外部表的好处是数据可以随时从hdfs中挂载进表中
使用分区的好处是可以缩短查询范围
下面的例子展示了如何创建外部表
CREATE EXTERNAL TABLE my_daily_report( last_update string, col_a string, col_b string, col_c string, col_d string, col_e string, col_f string, col_g string, col_h string, col_i string, col_j string) PARTITIONED BY ( par_dt string) location '/user/chenshu/data/daily';
挂载分区目录
alter table my_daily_report add partition (par_dt='20140530') location '/user/chenshu/data/daily/my_daily_report/20140530';
上面的例子只使用了一个分区,其实还可以使用多个分区,比如一个分区管理日报表,这个分区对应一个目录,在这个目录下还可以有小时分区,用不同的目录存放不同小时的报表。这时,分区之间的关系就是目录树的关系。
删除分区
当然也要提供一个删除part_dt='20140530'分区的方法:
alter table my_daily_report drop partition (par_dt='20140530')
drop partition会将分区以及数据都删除,drop partition_spec会只删除分区元数据,不删除数据。
注意,HIVE中没有delete from语句,如果仅仅是删除某个分区里所有语句,刚好这里可以使用drop partition来实现。
用分区查询
既然有了分区,如果紧要查找该分区上的数据,在where中指定分区目录作为查询条件,要快很多
select count(*) from my_daily_report where par_dt='20140531';
推荐文章:
http://my.oschina.net/leejun2005/blog/82065
0 0
- Hive创建外部表以及分区
- hive创建带分区的外部表
- hive外部表及分区
- Hive创建外部表
- hive 内部表,外部表,分区
- hive外部表使用分区partition
- Hive 外部表使用分区 Partition
- Hive创建表和分区
- Hive创建外部表异常
- hive的三板斧:内部表和外部表、分区和分桶以及序列化/反序列化(SerDe)
- Hive中如何创建内部表和外部表以及它们的区别
- hive通过jdbc创建表,分区,桶
- shell定时创建Hive表分区
- hive 创建分区
- hive创建分区步骤:
- hive中的表、外部表、分区和桶的理解
- Hive创建外部分区表
- MapReduce基础开发之七Hive外部表分区
- 使用typedef语句定义数组类型
- IOS_多线程_ASI_AFN_UIWebView
- jee标签使用小结
- 三层架构实战篇—系统登录实例【好】
- 阅读人生-《世界因你不同—李开复自传》里的话
- Hive创建外部表以及分区
- UIViewContentMode各类型效果
- 从调用暴风影音放片说起
- [Spring3.x] 第 15 章 Spring MVC : 第 四 篇 业务层及 web 层技术开发
- 在Java语言中调用存储过程、存储函数、包头、包体
- 待机唤醒及一些调试处理
- UVa401 回文词
- 【转载】ACM感悟
- Ubuntu 14.04 安装配置 cairo-dock 实现美化+特效