Sqoop 加载数据到ORC表
来源:互联网 发布:许嵩如果当时知乎 编辑:程序博客网 时间:2024/06/07 08:45
sqoop目前支持直接从RDBMS加载数据到Hive的ORC表,这可以通过两种方式实现。
- 先创建Hive ORC表,然后用sqoop import命令将数据导入到Hive ORC表
- 利用sqoop import同时创建Hive ORC表并加载数据
这里简单测试一下用sqoop从Oracle表导入到Hive ORC表,具体方法如下
(1)
//hive CLI创建orc测试表hive> create table hive_orc1(a int, b string, c string, d int, e string, f string) stored as orc;OKTime taken: 0.254 secondshive> show create table hive_orc1;OKCREATE TABLE `hive_orc1`( `a` int, `b` string, `c` string, `d` int, `e` string, `f` string)ROW FORMAT SERDE 'org.apache.hadoop.hive.ql.io.orc.OrcSerde'STORED AS INPUTFORMAT 'org.apache.hadoop.hive.ql.io.orc.OrcInputFormat'OUTPUTFORMAT 'org.apache.hadoop.hive.ql.io.orc.OrcOutputFormat'LOCATION 'hdfs://nameservice1/user/hive/warehouse/hive_orc1'TBLPROPERTIES ( 'transient_lastDdlTime'='1490084866')//sqoop import命令加载数据sqoop-import --connect jdbc:oracle:thin:@10.10.11.16:1521/esgyn --username system --password 12345 --table TEST_GROUPBY --split-by A --hcatalog-table hive_orc1 --hive-overwrite --null-string '\\N' --null-non-string '\\N' --verbose
(2)
//sqoop import直接创建hive orc表并加载数据sqoop-import --connect jdbc:oracle:thin:@10.10.11.16:1521/esgyn --username system --password 12345 --table TEST_GROUPBY --split-by A --create-hcatalog-table --hcatalog-table hive_orc2 --hcatalog-storage-stanza 'stored as orc tblproperties ("orc.compress"="SNAPPY")'//检查创建的hive orc表hive> show create table hive_orc2;OKCREATE TABLE `hive_orc2`( `a` decimal(38,0), `b` char(10), `c` char(10), `d` decimal(38,0), `e` char(10))ROW FORMAT SERDE 'org.apache.hadoop.hive.ql.io.orc.OrcSerde'STORED AS INPUTFORMAT 'org.apache.hadoop.hive.ql.io.orc.OrcInputFormat'OUTPUTFORMAT 'org.apache.hadoop.hive.ql.io.orc.OrcOutputFormat'LOCATION 'hdfs://nameservice1/user/hive/warehouse/hive_orc2'TBLPROPERTIES ( 'orc.compress'='SNAPPY', 'transient_lastDdlTime'='1490086049')Time taken: 0.066 seconds, Fetched: 17 row(s)
1 0
- Sqoop 加载数据到ORC表
- sqoop数据加载
- sqoop使用hcatlog生成对应的orc格式的表
- sqoop导入导出表/数据到Hive
- sqoop导出hive表数据到mysql
- sqoop导入数据到hive
- sqoop导入数据到hive
- Sqoop导入数据到Hive
- Sqoop导入数据到hdfs
- sqoop把hive表数据导入到mysql中
- 使用Sqoop将Hive表数据导入到mysql
- Sqoop将MySQL中数据导入到Hive表中
- Sqoop数据迁移,工作机制,sqoop安装(配置),Sqoop的数据导入,导入表数据到HDFS,导入关系表到HIVE,导入到HDFS指定目录,导入表数据子集,按需导入,增量导入,sqoop数据导出
- 用sqoop导入数据到hive中
- sqoop 导入mysql数据到hive
- sqoop 导oracle数据到hive
- sqoop 导入数据到HDFS注意事项
- sqoop同步mysql数据到hive中
- LiteRouter
- 纯CSS 仿某网站 loading加载动画
- HDU 1033 Edge
- docker 的启动
- PL SQL删除对象语句
- Sqoop 加载数据到ORC表
- 图的遍历-深度优先遍历
- js预解析介绍
- 注释驱动的 Spring cache 缓存介绍
- 【APIO2010T2】巡逻-贪心+树形DP
- 移植Qt-4.8.5出现undefined reference to '__sync_sub_and_fetch_4'
- LOG的properties
- jquery判断两个数组中相同元素
- Jacobian