hive数据类型(翻译自Hive Wiki)
来源:互联网 发布:地图生成软件 编辑:程序博客网 时间:2024/04/27 16:09
翻译自 https://cwiki.apache.org/confluence/display/Hive/LanguageManual+Types
列类型
Hive支持的数据类型如下:
原生类型:
- TINYINT
- SMALLINT
- INT
- BIGINT
- BOOLEAN
- FLOAT
- DOUBLE
- STRING
- BINARY (Hive 0.8.0以上才可用)
- TIMESTAMP (Hive 0.8.0以上才可用)
复合类型:
- arrays: ARRAY<data_type>
- maps: MAP<primitive_type, data_type>
- structs: STRUCT<col_name : data_type [COMMENT col_comment], ...>
- union: UNIONTYPE<data_type, data_type, ...>
时间戳
支持传统的unix时间戳,可选的纳秒级精度。
支持的转换:
- 整型数值类型:解读为以秒为单位的UNIX时间戳
- 浮动点数值类型:解读为以秒和小数精度为单位的UNIX时间戳。
- 字符串:JDBC兼容的java.sql.Timestamp格式“YYYY-MM-DD HH:MM:SS.fffffffff”(9位小数位精度)
时间戳被解释是与timezone无关,存储为从UNIX纪元的偏移量。提供便利的UDF和时区转换(to_utc_timestamp,from_utc_timestamp)。
所有现有datetime的UDF(月,日,年,小时,等)可以工作于TIMESTAMP数据类型。
Union类型
Union类型可以在同一时间点,保持恰好有一个指定的数据类型。您可以使用create_union的UDF创建一个实例的类型:
CREATE TABLE union_test(foo UNIONTYPE<int, double, array<string>, struct<a:int,b:string>>);SELECT foo FROM union_test;{0:1}{1:2.0}{2:["three","four"]}{3:{"a":5,"b":"five"}}{2:["six","seven"]}{3:{"a":8,"b":"eight"}}{0:9}{1:10.0}
第一部分,对于union的发序列化来说是一个tag,让它知道哪个union的部分被使用。在例子0,表明声明的第一个数据类型,即是int,其他如此。
创建union,必须提供为create_union UDF提供tag。
SELECT create_union(0, key), create_union(if(key<100, 0, 1), 2.0, value), create_union(1, "a", struct(2, "b")) FROM src LIMIT 2;{0:"238"} {1:"val_238"} {1:{"col1":2,"col2":"b"}}{0:"86"} {0:2.0} {1:{"col1":2,"col2":"b"}}
常量
数值类型
默认,数值类型认为是INT,除非INT超出了INT的范围,那么会被解释为BIGINT,或者是如下的后缀在数值中被使用。
字符串类型
字符串可以用单引号(')或双引号(“)。Hive在字符串中使用C-Style的转义。
浮点类型
浮点类型数值,被假定为双浮点类型。目前还不支持科学记数法。
NULL值的处理
遗漏的值被代表为特殊值NULL。 要导入NULL字段的数据,需要查阅使用的SerDe的文档。 (默认的文本格式使用LazySimpleSerDe的解释字符串\ N为NULL)
0 0
- hive数据类型(翻译自Hive Wiki)
- hive数据类型(翻译自Hive Wiki)
- hive数据类型(翻译自Hive Wiki)
- Hive Explain(翻译自Hive wiki)
- hive Cli常用操作(翻译自Hive wiki)
- hive 创建/删除/截断 表(翻译自Hive wiki)
- hive 创建/删除/截断 表(翻译自Hive wiki)
- hive 创建/删除/截断 表(翻译自Hive wiki)
- hive 创建/删除/截断 表(翻译自Hive wiki)
- Hive lateral view语句(翻译自Hive wiki)
- hive 创建/删除/截断 表(翻译自Hive wiki)
- hive数据类型-摘录至HIVE WIKI
- hive 文档 wiki-doc
- hive数据类型
- hive数据类型
- hive 数据类型
- hive 数据类型
- Hive数据类型
- 邮件日志分析工具pflogsumm
- 通过QDisk增强Red Hat Cluster Suite的仲裁机制(Quorum)
- 多路径环境下RHCS和GFS的timeout配置
- oracle误删除数据的恢复方法
- Oracle误删数据恢复方法总结
- hive数据类型(翻译自Hive Wiki)
- Excel 计算两个日期间相差的天数、月数或年数 DATEDIF函数
- Order-level sales credit total () must equal 100%.
- IE for Oracle:找不到元素 common2_3_6_9.js
- Socket连接超时
- 将IE的默认搜索引擎换成Google
- Outlook 2007 For XP日历提醒时会自动重启
- DNS,DHCP的备份恢复(批处理自动实现)
- 胖AP与瘦AP区别