hive学习笔记

来源:互联网 发布:linux给文件设置权限 编辑:程序博客网 时间:2024/05/08 20:27

Hive目前还不支持事务;不能对表数据进行修改(不能更新、

删除、插入;只能通过文件追加数据、重新导入数据);不能对列建立索引(但

Hive支持索引的建立,但是不能 高Hive的查询速度。如果你想 高Hive

查询速度,请学习Hive的分区、桶的应用 



1:在服务器上通过hive进入hive编辑界面

2:hive的in无法支持select子句

3:hive的yyyy-MM-dd HH:mm:ss 转 yyyy-MM-dd的方式是to_date(time)

4:hive通过show tables like '*names*'去查询这个库是否有某个table

5:hive的分区字段通过show create table names后的PARTITIONED BY参数

6:hive中group by后select选项中只能有group by的列和其他列的聚合查询

7:hive中有动态分区的,如果在查询中通过添加特定的分区位置,查询会更快,分区结构通过show create table查看其中的PARTITIONED BY的字段

8:将hive的查询结果导入本地,只需要在查询语句前面加上insert overwrite local directory "/home/test/"

9:通过select INPUT__FILE__NAME from table where dt='20170303' limit 10;可以直接查询到该分区具体的存放位置

10:show partitions tablename;显示该表目前的分区情况

11:显示查询的列名:set hive.cli.print.header=true;
12:hive -e "$v_sql;" 通过-e来实现shell查询hive
0 0
原创粉丝点击