程序博客网 > 拓尔思知乎

mysql处理Latin 中文繁体字乱码解决方案

来源：互联网发布：拓尔思知乎编辑：程序博客网时间：2024/04/29 19:08

问题描述：

1. 对于一些中文繁体字符select出来出现乱码，出问题的繁体字如：燈、龍等

环境描述：

数据库编码：

+--------------------------+----------------------------------------+

| Variable_name | Value |

+--------------------------+----------------------------------------+

| auto_increment_offset | 1 |

| character_set_client | latin1 |

| character_set_connection | latin1 |

| character_set_database | latin1 |

| character_set_filesystem | binary |

| character_set_results | latin1 |

| character_set_server | latin1 |

| character_set_system | utf8 |

| character_sets_dir | D:/Program Files/mysql/share/charsets/ |

+--------------------------+----------------------------------------+

数据库表编码：也同意使用latin1编码方式

由于数据库由DBA负责，并且库结构为了保持一致（我们使用备份库），从而不能修改数据库编码

问题排查：

1.mysql 的jdbc驱动源代码拷贝下来DEBUG，最终发现了问题根源在驱动中CharSetMapping.class该类中的getJavaEncodingForMysqlEncoding(String mysqlEncoding,Connection conn)方法，该方法源代码如下：

public final static String getJavaEncodingForMysqlEncoding(String mysqlEncoding,Connection conn) throws SQLException {if (conn != null && conn.versionMeetsMinimum(4, 1, 0) && "latin1".equalsIgnoreCase(mysqlEncoding)) {return "Cp1252";}return (String) MYSQL_TO_JAVA_CHARSET_MAP.get(mysqlEncoding);}

这里Latin1编码就是iso-8859-1编码。问题就出在这里，mysql驱动对Latin1编码做了特殊处理，转为cp1252，但cp1252依然属于Latin1系编码，故显示中文依然会存在乱码，故需要在GBKstring中转化cp1252.

这么做了以后，发现我看到的中文都不再乱码OK，包括一些繁体字和火星文，大功告成了。

过了一天，我们测试给我反馈结果，说一些繁体字依然存在乱码，比如“燈、龍”等，在页面上显示“？”，究竟哪儿出了问题？继续DEBUG，

发现普通汉字从Latin1转码为cp1252后的byte array中的数据中，用两个字节表示一个汉字时，能够在GBK编码映射表中找到byte array对应的2字节数据，而“燈、龍”两个繁体字转cp1252后，其对应的byte array中的2字节数据无法再GBK编码中找到（既GBK中无法找到该2字节数据对应的汉子），从而出现“？”。

故问题应该就出现在这里，既从latin1->cp1252->gbk这样一个过程会出现以下编码数据丢失。从而解决方案也是很明显的：

既：去掉中间转cp1252的步骤，直接将Latin1 转gbk，同时gbkString中不处理，将上面代码修改为：

public final static String getJavaEncodingForMysqlEncoding(String mysqlEncoding,Connection conn) throws SQLException {if (conn != null && conn.versionMeetsMinimum(4, 1, 0) && "latin1".equalsIgnoreCase(mysqlEncoding)) {return "gbk";}return (String) MYSQL_TO_JAVA_CHARSET_MAP.get(mysqlEncoding);}

再一测试，问题解决！

拓尔思知乎

拓尔思知乎

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子迪拜旅游怎么样迪拜铂尔曼酒店迪拜旅游购物攻略春节去迪拜旅游迪拜旅游带什么迪拜的豪华酒店阿联酋迪拜旅游 dubai 阿联酋 dibai 土耳其的旅游中国100元相当迪拜多少钱迪昂迪普科技迪普迪普科技股吧迪普科技股票迪普科技算大公司吗 300768迪普科技迪曲迪曲dj大全迪曲大全冰河时代迪曲迪森股份迪森迪森股份股吧 300335 300335迪森股份卡迪森手表怎么样 harryson 哈迪森卡迪森手表价格沃迪森 harryson哈迪森卡迪森女表爱迪森家具欧迪森家具哈迪森皮具惠迪森药业卡迪森手表质量怎样迪沙迪沙药业