Hive集合数据类型(Struct,Map,Array)
来源:互联网 发布:淘宝网禁止发布违背 编辑:程序博客网 时间:2024/06/06 13:56
Hive的列除了支持基本的数据类型外,还支持使用Struct、Map和Array三种集合数据类型。
假设某表有如下一行,我们用JSON格式来表示其数据结构。在Hive下访问的格式为
{ "name": "John Doe", "salary": 100000.0 , "subordinates": ["Mary Smith" , "Todd Jones"] , //列表Array, "deductions": { //键值Map, "Federal Taxes": 0.2 , "State Taxes": 0.05, "Insurance": 0.1 } "address": { //结构Struct, "street": "1 Michigan Ave." , "city": "Chicago" , "state": "IL" , "zip": 60600 }}
基于上述数据结构,我们在Hive里创建对应的表,并导入数据。
创建本地测试文件test.txt
John Doe,100000.0,Mary Smith_Todd Jones,Federal Taxes:0.2_State Taxes:0.05_Insurance:0.1,1 Michigan Ave._Chicago_1L_60600Tom Smith,90000.0,Jan_Hello Ketty,Federal Taxes:0.2_State Taxes:0.05_Insurance:0.1,Guang dong._China_0.5L_60661
ps:注意,MAP,STRUCT和ARRAY里的元素间关系都可以用同一个字符表示,这里用“_”。
Hive上创建测试表employees
CREATE TABLE learn.employees(name STRING,sa1ary FLOAT,subordinates ARRAY<STRING>,deductions MAP<STRING, FLOAT>,address STRUCT<street:STRING, city:STRING, state:STRING, zip:INT>)ROW FORMAT DELIMITEDFIELDS TERMINATED BY ',' -- 列分隔符COLLECTION ITEMS TERMINATED BY '_' --MAP STRUCT 和 ARRAY 的分隔符(数据分割符号)MAP KEYS TERMINATED BY ':' -- MAP中的key与value的分隔符LINES TERMINATED BY '\n'; -- 行分隔符
导入文本数据到测试表
load data local inpath "/home/hadoop/files/input/test.txt" overwrite into table learn.employees ;
访问三种集合列里的数据,以下分别是ARRAY,MAP,STRUCT的访问方式
hive> select subordinates[1], deductions['Federal Taxes'],address.city from learn.employees;OKTodd Jones 0.2 ChicagoHello Ketty 0.2 ChinaTime taken: 0.123 seconds, Fetched: 2 row(s)
阅读全文
0 0
- Hive集合数据类型(Struct,Map,Array)
- Hive数据类型-集合类型(Array-Map-Struct)的尝试
- hive复合数据类型 array、map、struct使用
- HIVE的数据类型hive array、map、struct使用
- hive struct\map\array
- hive map,struct,array
- Hive复合数据类型array,map,struct的使用
- Hive复合数据类型array,map,struct的使用
- hive array、map、struct使用
- hive array、map、struct使用
- hive array、map、struct使用
- hive array、map、struct使用
- hive array、map、struct使用
- hive array、map、struct使用
- hive array、map、struct使用
- hive array、map、struct使用
- hive array、map、struct使用
- hive array、map、struct使用
- postgresql参数full_page_writes详解
- 解决远程连接mysql错误1130
- iOS 判断相机权限是否被限制,判断相机是否可以使用
- Android 开发进阶: 自定义 View 1-1 绘制基础
- Linux inode节点
- Hive集合数据类型(Struct,Map,Array)
- 数据库基础学习
- bzoj 1103(DFS序+树状数组)
- ospf部署过程--待完善
- 数据库索引到底是什么,是怎样工作的?
- Angular最新教程-第十四节 指令 结构型指令 属性型指令 自定义指令
- andriod中一些需要注意的问题
- 点云学习之点云分割之导语
- scp 命令传文件