trafodion导入ORC文件压缩方式是snappy
来源:互联网 发布:数据挖掘软件 编辑:程序博客网 时间:2024/06/06 17:40
1. 在hive里面创建一个外表:
create external table `orc_03`(`id` int,`bid` string,`code` string,`name` string,`info` string,`qrcode` string,`ts` string,`month` int)stored as orc tblproperties ("orc.compress"="snappy");
2. 把orc文件put到hdfs文件系统里面:
hadoop fs -put /home/trafodion/testData/bizs.orc/part-00000-be341e01-a6a1-4180-b7e8-7cbe76ba4ded.snappy.orc /user/hive/warehouse/orc_03
3. 在hive中查看表记录:
select * from orc_03;
4. 在trafodion数据库里面创建结构和hive表一样的,但是字段都要设置成 utf8编码:
create table orc_03(id varchar(40 BYTES) CHARACTER SET UTF8,bid varchar(40 BYTES) CHARACTER SET UTF8,code varchar(40 BYTES) CHARACTER SET UTF8,name varchar(60 BYTES) CHARACTER SET UTF8,info varchar(50000 BYTES) CHARACTER SET UTF8,qrcode varchar(80 BYTES) CHARACTER SET UTF8,ts varchar(70 BYTES) CHARACTER SET UTF8,month_time varchar(40 BYTES) CHARACTER SET UTF8);
5. load hive表到trafodion表
Load into orc_03 select * from hive.hive.orc_03;
6. 在创建表的时候可以用下面命令查看文件内容,从而判断是否有分区,和表字段信息。(备注:这个是hdfs里面的文件)
hive --orcfiledump /user/hive/warehouse/orc_01/month=1/part-00000-be341e01-a6a1-4180-b7e8-7cbe76ba4ded.snappy.orc | more
阅读全文
0 0
- trafodion导入ORC文件压缩方式是snappy
- Hadoop列式存储引擎Parquet/ORC和snappy压缩
- Hadoop列式存储引擎Parquet/ORC和snappy压缩
- snappy压缩
- Snappy压缩
- hive 存储格式和压缩方式 一:Snappy + SequenceFile
- Snappy主包含文件 [snappy/snappy.h]
- Hadoop压缩-SNAPPY算法
- Hadoop压缩算法snappy
- hadoop 压缩-snappy
- 配置Snappy压缩
- 配置Snappy压缩
- python使用snappy压缩
- HBase开启Snappy压缩
- HBase开启Snappy压缩
- MapReduce读写orc文件
- 【Hadoop/Hbase】centos上安装并设置Snappy/LZO压缩方式
- 使用Snappy 压缩方式报错“java.lang.UnsatisfiedLinkError: no snappyjava in java.library.path”
- Python Study (01) 之 特殊方法
- yii框架所搜分页
- Zookeeper Golang客户端:go-zookeeper的基本使用
- yum安装报错“Error: xz compression not available”
- 超级记忆法(3)——第一小时
- trafodion导入ORC文件压缩方式是snappy
- 2048小游戏c语言实现
- 作为初学者学C语言的小小总结
- 机器学习-决策树和随机森林
- 输出时间和成绩平均分到指定位置
- 属性、点语法
- Java常用排序算法
- UVa927
- 关于Linux开发板与虚拟机liunx的连接。