hive中文乱码的解决办法

来源:互联网 发布:前端自学软件 编辑:程序博客网 时间:2024/05/22 07:39
   在HIVE中建表的时候,有时候难免要表中文注释,然而如果不经过配置,会导致desc某个表名的时候,直接以?的方式返回。   因此也来解决一下HIVE中文注释乱码的问题。由于HIVE的元数据是存在于MYSQL上的,因此需要在MYSQL上进行元数据的候。

当hive使用mysql作为元数据库的时候mysql的字符集要设置成latin1 default。
alter database hive character set latin1;
为了保存那些utf8的中文,要将mysql中存储注释的那几个字段的字符集单独修改为utf8。

1.修改字段注释字符集

 修改mysql-hive数据库当中的COLUMNS_V2表      alter table COLUMNS_V2 modify column COMMENT varchar(256) character set utf8;

2.修改表注释字符集

修改mysql-hive数据库当中的TABLE_PARAMS表        alter table TABLE_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8;

3.修改分区表参数,以支持分区键能够用中文表示

 修改mysql-hive数据库当中的PARTITION_PARAMS与PARTITION_KEYS表          alter table PARTITION_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8;          alter table PARTITION_KEYS modify column PKEY_COMMENT varchar(4000) character set utf8;

如果以上修改还不成功,需要在hive-site.xml修改mysql对于hive的编码为utf8

4.修改相关表相关字段编码

   alter table  INDEX_PARAMS  modify column PARAM_VALUE  varchar(4000) character set utf8;
0 0