Hive 5. 数据类型

来源:互联网 发布:4g通信软件 编辑:程序博客网 时间:2024/05/22 13:49

数据类型

Hive 中支持大多数的基本数据类型,和3个其他数据库中烧少有的集合数据类型。
基本数据类型包括 numeric, Boolean, string, timstamp等等.
复杂数据类型有: arrays,maps,structs。
见下表:

image

基本数据类型

Hive 的基本数据类型与 Java 的数据类型相合,即使一些名字是受了 Mysql 类型的名字的影响。
与Java中的对应关系:

Hive Java 字节数 INTYINT byte 1 SMALLINT short 2 INT int 4 BIGINT long 8 FLOAT float 32 bit DOUBLE double 64 bit STRING String

除此之外,DECIMAL 与 oracle 的 number 类型相似。默认长度为10位整数,最大允许长度为 38。

DECIMAL(10,4)

STRING 类型是一个没有长度限制的字符串(不过理论上是 2G),VARCHAR 与 CAHR 就不说了。

TIMESTAMP 存储的是纳秒精度的时间戳。可以使用 to_utc_timestamp 和 from_utc_timestamp 来与 DATE 类型互相转换。

集合数据类型

这里要说的是 UNION, 他可以存储由多个不同数据类型组成的集合。往集合中放入的数据必须与集合中的各个数据类型相匹配,且使用从1开始的标志选取相应的值。

数据转型

image

  • 整型遵循小转大。可转成文本。
  • 文本类型之间可以随意转换。
  • 上面这些都可以转型为 DOUBLE 或者 DECIMAL。
  • 布尔不能转成其他类型。
  • TIMESTAMP 与 DATE 前文提到。

一个例子

create table complex (    c1 array<int>,    c2 map<string, int>,    c3 struct<a:string, b:int, c:double>    c4 uniontype<string, int>);

查询的例子:

hive> select c1[0], c2['b'], c3.c, c4 from complex;1   2   1.0     {1:63}

End!!

0 0
原创粉丝点击