跨Hadoop平台Hive表export和import迁移
来源:互联网 发布:淘宝联盟首页登录 编辑:程序博客网 时间:2024/04/29 21:33
场景:两个Hadoop平台集群之间Hive表迁移。
思路:Hive表元数据和文件数据export到HDFS文件,通过Distcp将HDFS迁移到另一个集群的HDFS文件,再通过import在新Hive中建表;
1、原平台:Hive表元数据和文件数据到export到平台HDFS文件
2)可以看到hdfs输出目录下有元数据和文件数据;
可看到文件路径是:hdfs://nameservice-ha/user/hive/warehouse/conf_adsl_app
在新平台下不存在/user/hive/warehouse/conf_adsl_app目录,import时会自动生成相应目录。
2、用distcp从原平台将/tmp/hive-export/conf_adsl_app/下数据迁移到新平台。
注意下面用的distcp语法涉及到从非安全集群迁移到安全集群(kerberos)的操作。
在新平台执行命令:
3、新平台:从HDFS文件import到Hive生成新表
1)hive下执行命令:
LOCATION
'hdfs://c9/apps/hive/warehouse/cwh.db/new_conf_adsl_app'
3)查看location目录下hive表对应的文件
思路:Hive表元数据和文件数据export到HDFS文件,通过Distcp将HDFS迁移到另一个集群的HDFS文件,再通过import在新Hive中建表;
1、原平台:Hive表元数据和文件数据到export到平台HDFS文件
1)hive下执行如下命令:
#export table conf_adsl_app to '/tmp/hive-export/conf_adsl_app';conf_adsl_app表的外部存储路径:hdfs://nameservice-ha/user/hive/warehouse/conf_adsl_app
2)可以看到hdfs输出目录下有元数据和文件数据;
hadoop fs -ls /tmp/hive-export/conf_adsl_app/ Found 2 items -rwxr-xr-x 3 hdfs supergroup 1309 2017-03-16 08:03 /tmp/hive-export/conf_adsl_app/_metadata drwxr-xr-x - hdfs supergroup 0 2017-03-16 08:03 /tmp/hive-export/conf_adsl_app/data3)3)查看hadoop fs -cat /tmp/hive-export/conf_adsl_app/_metadata元文件
可看到文件路径是:hdfs://nameservice-ha/user/hive/warehouse/conf_adsl_app
在新平台下不存在/user/hive/warehouse/conf_adsl_app目录,import时会自动生成相应目录。
2、用distcp从原平台将/tmp/hive-export/conf_adsl_app/下数据迁移到新平台。
注意下面用的distcp语法涉及到从非安全集群迁移到安全集群(kerberos)的操作。
在新平台执行命令:
hadoop distcp -D ipc.client.fallback-to-simple-auth-allowed=true -D dfs.checksum.type=CRC32 webhdfs://namenode ip:50070/tmp/hive-export/conf_adsl_app/ /flume/his/
可以看到新平台/flume/his目录下有文件:
hadoop fs -ls /flume/his/conf_adsl_app/Found 2 items-rw-r--r-- 3 etl etl 1309 2017-03-16 08:49 /flume/his/conf_adsl_app/_metadatadrwxr-xr-x - etl etl 0 2017-03-16 08:49 /flume/his/conf_adsl_app/data
3、新平台:从HDFS文件import到Hive生成新表
1)hive下执行命令:
#import table new_conf_adsl_app from '/flume/his/conf_adsl_app';2)可以看到hive上新生成了new_conf_adsl_app表
LOCATION
'hdfs://c9/apps/hive/warehouse/cwh.db/new_conf_adsl_app'
3)查看location目录下hive表对应的文件
hadoop fs -ls /apps/hive/warehouse/cwh.db/new_conf_adsl_appFound 1 items-rwxrwxrwx 3 etl hdfs 18227 2017-03-16 08:51 /apps/hive/warehouse/cwh.db/new_conf_adsl_app/adsl_apps_20130829.txt
自此跨平台Hive表迁移完成。
0 0
- 跨Hadoop平台Hive表export和import迁移
- hive集群间数据迁移,export+import
- HIVE export import
- DB2数据迁移之export/import
- hadoop跨集群之间迁移hive数据
- export default 、 export 和import 区别
- DLL的Export和Import
- DLL的Export和Import
- DLL的Export和Import
- DLL的Export和Import
- DLL的Export和Import
- DLL的Export和Import
- DLL的Export和Import
- DLL的Export和Import
- DLL的Export和Import
- DLL的Export和Import
- ORACLE_SQL:Export和Import命令
- DLL的Export和Import
- sfgdsg
- 菜单组件
- iOS 推送后台语音播报
- adb shell ip命令参数说明
- Go的异常处理 defer, panic, recover
- 跨Hadoop平台Hive表export和import迁移
- 谈谈项目收尾
- iOS指纹识别登录流程及实现
- jquery 中 $.map 的使用方法
- 【Python】Notepad++配置Python编译器
- c#时间日期的获取和表示
- ML ME MAP
- IK Analyzer 2012 版本
- 微软上线企业聊天工具Teams 挑战收购未果的Slack