hive 操作(四)

来源:互联网 发布:网络变压器信号定义 编辑:程序博客网 时间:2024/06/07 10:03

Hive 基础及安装
Hive 操作(一)
hive 操作(二)——使用 mysql 作为 hive 的metastore
hive 操作(三)——hive 的数据模型
hive 操作(四)

distinct:去重

视图

使用视图可以屏蔽复杂的操作;
还可进行权限的控制;

hive> create view v1 as select * from t1;

limit clause

Limit 限制查询的记录数,返回的结果是随机选择的,

hive> select * from t1 limit 5;

sort by & order by

  • sort by

    多个 reduce,内部排序

  • order by

    一个 reduce,总排序

Java 操作

Java API 操作之前,必须启动 hive 的远程服务,在 linux 中执行如下的命令:

[root@hadoop0 ~]# hive --service hiveserver >/dev/null  2>/dev/null &

在 hive 1.2 及以上的版本(不再支持 hive),如下更为简洁的命令:

[root@hadoop0 ~]# hiveserver2 &

内置函数 & UDF(User Defined Function)

hive>             # 键入 tab 键会提示是否显示全部的函数信息hive> describe function substr;            # 相当于 man 操作,输出函数使用信息hive> select sum(id) from t2;           
0 0
原创粉丝点击