利用sqoop1将mysql数据导入至hive多分区
来源:互联网 发布:国外网络购物网站 编辑:程序博客网 时间:2024/05/17 09:45
本文主要是记录sqoop1 将 mysql数据导入至hive多分区的方法, 之前项目中碰到这个需求, 在sqoop官网,google,baidu上参考了一些资料,均感觉不满意, 看到hcatalog插件, 于是自己尝试了一下, 做个总结:
一般的做法是, 先初始化hive分区值, 再将数据导入到分区目录:
建表语句略...
初始化hive分区, 该分区下不可以有数据:
alter table bd_ods.src_wifi_loacationdata_his add partition (prt_month='201707',prt_date='20170703')
将数据导入分区目录:
sqoop import --append --connect ${jdbcUrl} --username ${uName} --password ${uPswd} --query 'select * from wifi_locationdata WHERE ID_ROW_SEQ_NO >=200 and ID_ROW_SEQ_NO <300 and $CONDITIONS' --target-dir '/apps/hive/warehouse/bd_ods.db/src_wifi_loacationdata_his/prt_month=201707/prt_date=20170703' --hive-database 'bd_ods' --hive-table 'src_wifi_loacationdata_his' --split-by id_row_seq_no
全量导入:
sqoop import -m 1 --connect ${jdbcUrl} --username ${uName} --password ${uPswd} --table wifi_locationdata --hcatalog-database bd_ods --hcatalog-table src_wifi_loacationdata_his --hcatalog-partition-keys prt_month,prt_date --hcatalog-partition-values 201707,20170701增量导入, 这里不支持默认的增量参数(--incremental, --check-column, --last-value), 可通过query将增量数据查询出来:
sqoop import -m 1 --connect ${jdbcUrl} --username ${uName} --password ${uPswd} --query 'select * from wifi_locationdata WHERE ID_ROW_SEQ_NO <100 and $CONDITIONS' --hcatalog-database bd_ods --hcatalog-table src_wifi_loacationdata_his --hcatalog-partition-keys prt_month,prt_date --hcatalog-partition-values 201707,20170701
阅读全文
0 0
- 利用sqoop1将mysql数据导入至hive多分区
- 使用sqoop1将hive导入mysql
- 使用sqoop1,将sqlserver数据导入hive
- Sqoop1.4.4将MySQL中数据导入到Hive表中
- OOzie调度sqoop1 Action 从mysql导入数据到hive
- 利用sqoop将hive数据导入导出数据到mysql
- 利用sqoop将hive数据导入导出数据到mysql
- 利用sqoop将hive数据导入导出数据到mysql
- 利用sqoop将hive数据导入导出数据到mysql
- 利用sqoop将hive数据导入导出数据到mysql
- 利用sqoop将hive数据导入导出数据到mysql
- 利用sqoop将hive数据导入导出数据到mysql
- 利用sqoop从mysql向多分区hive表中导入数据
- sqoop1.4.5将mysql中的数据导入到HBase中
- 使用sqoop1.99.6将mysql数据导入到hdfs
- Sqoop1.4.4使用增量导入模式将MySQL数据库中数据导入到HDFS中
- 利用sqoop将hive数据导入导出数据到mysql (转)
- 将Hive表数据导入到mysql
- BZOJ 2565 最长双回文串 (Manacher)
- 阿里聚安全移动安全专家分享:APP渠道推广作弊攻防那些事儿
- 个人对贪心的理解
- 从零开始学_JavaScript_系列(49)——Promise(2)then、值、catch
- 2017 年用于 UI 设计的 CSS3 和 JavaScript 动画库
- 利用sqoop1将mysql数据导入至hive多分区
- 爬虫 登录csdn并获取个人博客文章列表
- React-Native开发中Could not connect to development server
- NSIS打包的软件开启时已安装检测机制
- I/O多路复用:select poll epoll
- PAT甲级1001. A+B Format
- 纯css3写动物摇尾巴的特效
- 2017多校联合第二场 1003题 hdu 6047 Maximum Sequence O(n) (有理有据地)贪心
- Dungeon Master