impala-kudu相关问题经验总结

来源:互联网 发布:淘宝联盟怎么找pid 编辑:程序博客网 时间:2024/05/12 06:41

今天在hue上执行数据的重新导入:

1、删除原先的kudu表:drop table  events_tab_2;

2、需要在impala里创建kudu新表:

CREATE TABLE  events_tab_2(   user_id STRING ,   item_id STRING ,   create_time BIGINT ,   col_1 STRING ,   col_12 STRING ,   col_13 STRING ,   col_14 STRING ,   col_15 STRING ,   col_16 STRING ,   col_17 BIGINT ,   col_18 BIGINT ,   col_19 STRING ,   col_20 DOUBLE ,   col_21 BIGINT ,   col_22 BIGINT ,   col_23 BIGINT ,   col_24 STRING ,   col_25 STRING ,   col_26 STRING ,   col_28 BIGINT ,   col_32 STRING ,   PRIMARY KEY (user_id, item_id, create_time) ) PARTITION BY HASH (user_id) PARTITIONS 16 STORED AS KUDU;

3、将数据导入。


在执行第2步的时候,遇到了坑和错误:



错误指示:这个表已经存在!

去impala表里和hdfs仔细检查后,这个表并不存在!

那问题在哪?

我搜了好多资料,也没有找到具体的解决方法,后来经过尝试探索,发现是

kudu单独存到了它自己的‘区域’;


解决方法:

在linux命令里输入:

kudu table delete master(master的主机名) 表名
需要注意的是,这个表名是:

impala::smg_user_2.events_tab_2

一定不要忘记前面的impala:: 这也是表名的一部分!


记录到此博客,供参考,交流。

原创粉丝点击