总结命令行02:Hive
来源:互联网 发布:数据挖掘的研究现状 编辑:程序博客网 时间:2024/05/29 17:36
一、概述:
Hive提供了很多的函数,可以在命令行下show functions罗列所有的函数,你会发现这些函数名与mysql的很相近,绝大多数相同的,可通过describe function functionName 查看函数使用方法。hive支持的数据类型很简单就INT(4 byte integer),BIGINT(8 byte integer),FLOAT(single precision),DOUBLE(double precision),BOOLEAN,STRING等原子类型,连日期时间类型也不支持,但通过to_date、unix_timestamp、date_diff、date_add、date_sub等函数就能完成mysql同样的时间日期复杂操作。
如下示例:
hive与mysql分区有些区别,mysql分区是用表结构中的字段来分区(range,list,hash等),而hive不同,他需要手工指定分区列,这个列是独立于表结构,但属于表中一列,在加载数据时手动指定分区。
创建表
创建表并创建索引字段ds
显示所有表
按正条件(正则表达式)显示表,
表添加一列
添加一列并增加列字段注释
更改表名
删除数据表
元数据存储
将本地文件中的数据加载到表中
加载本地数据,同时给定分区信息
加载DFS数据 ,同时给定分区信息
SQL 操作
按先件查询
将查询数据输出至目录
将查询结果输出至本地目录
选择所有列到本地目录
将一个表的统计结果插入另一个表中