从Kudu中导出、导入数据

来源:互联网 发布:mysql 如何使用 编辑:程序博客网 时间:2024/06/06 03:24

从kudu的表中导出数据,源码中提供了一系列的工具包。

kudu导出数据或者导入数据:

这是一个spark Application,根据代码中的用法:

这里写图片描述

可以选择导入或者导出数据
可以选择文件格式(csv,avro)
可以选择表名
可以选择输出路径
可以选择kudu的master

如果有特殊需求可以修改源码。


1. 用maven编译:

mvn package -DskipTests

2. 然后运行spark 任务

./spark-submit \--master local \--jars  /home/libs/spark-avro_2.11-3.2.0.jar \--class org.apache.kudu.spark.tools.ImportExportFiles \/home/kudu/kudu/java/kudu-spark-tools/target/kudu-spark2-tools_2.11-1.6.0-SNAPSHOT.jar \--operation=import --format=avro --master-addrs=192.168.1.1  --path=/data/apps/data/kudu/users --table-name=test_users

kudu源码中还有一些tools,用Maven编译后可以使用,具体使用可以看代码中的usage。