hadoop distcp 实现不同集群之间数据同步

来源:互联网 发布:一个二次元软件 有后山 编辑:程序博客网 时间:2024/05/16 10:31

1.相同hadoop版本同步数据

hadoop distcp -skipcrccheck -update -m 20 hdfs://dchadoop002.dx:8020/user/dc/warehouse/test /user/dc/warehouse/test


2.不同hadoop版本同步数据

hadoop distcp -skipcrccheck -update -m 20 hftp://ns1/user/test /user/dc/test


参数:

-m 表示并发数

-skipcrccheck 跳过hdfs校验

-update 更新文件

0 0
原创粉丝点击