Greenplum或DeepGreen中使用外部表访问Hive数据(分隔符是Hive表默认列分隔符)
来源:互联网 发布:淘宝快递盒上会有 编辑:程序博客网 时间:2024/05/16 11:53
在Greenplum或DeepGreen中,使用外部表访问Hive表的数据,并且文件数据的列分隔符是Hive默认的方式'\001'。
1. 查看数据(Hive默认列分隔符实际打印不可见,但是使用vi编辑器时,显示^A,可以通过先按Ctrl V ,再按A来输出)
[gpadmin@JSZ ~]$ cat ok.txt
1^ASpark2^AHadoop
2. 在Hive中创建表,包括并加载数据
hive> create table ok(id int,name string) row format delimited fields terminated by '\001' stored as textfile;hive> load data local inpath '/home/gpadmin/ok.txt' into table ok;
3. 在GP中创建外部表,并通过gphdfs协议读取HDFS上的数据文件
create external table ok (id int,name text) location ('gphdfs://JSZ:8020/user/hive/warehouse/ok') format 'TEXT' (DELIMITER E'\001');
注释:对于分隔符为多个的,需要使用E来指定。
4. 在GP中查看外部表数据
zhangyundb=# select * from ok;
select co id | name
----+--------
1 | Spark
2 | Hadoop
0 0
- Greenplum或DeepGreen中使用外部表访问Hive数据(分隔符是Hive表默认列分隔符)
- Hive 默认字段分隔符
- Hive表如何使用多字符分隔
- hive 导出数据分隔符
- hive 分隔符 ^A
- 有关hive 中默认的用控制符作为分隔符的使用总结
- hive如何处理多分隔符数据
- Hive数据导入预处理-分隔符处理
- hive 中控制符作为分隔符的使用总结
- Hive创建表时使用Unicode字符作为字段分隔符(hive unicode character as delimiter)
- [Hive]Hive指定查询输出分隔符
- hive-TextInputformat自定义分隔符
- hive多分隔符问题
- hive指定行分割符和列分隔符
- hive默认分隔符引起的日志分割问题
- hive指定多个字符作为列分隔符
- hive建外表时默认分隔符错误导致行数增加和数据错误
- Hive表中四种不同数据导出方式以及如何自定义导出列分隔符
- lucence入门
- Android SnackBar学习
- spring framework官方下载地址
- 常用Python的BIF指令
- DHTML:<input type="file">
- Greenplum或DeepGreen中使用外部表访问Hive数据(分隔符是Hive表默认列分隔符)
- 互联网公司KPI
- http post request header is too large 问题
- js 实现dom的控制
- MAC系统上设置华为手机的调试模式
- JavaScript---网络编程(10)--DHTML技术演示(3)-多选框
- ios 学习之 NSPredicate 模糊、精确、查询
- 更新百度地图,极光推送SDK 时无效
- 阅读程序(4)