java 与 mysql 中文问题的处理
来源:互联网 发布:哪里可以购买淘宝小号 编辑:程序博客网 时间:2024/05/23 17:19
<script src="http://www.google-analytics.com/urchin.js" type="text/javascript"></script> AD: jr (at) javaresearch.org
这个文章共有 0 条评论 上一篇文章 返回〔Java入门〕 下一篇文章
文字广告链接 自主、快速定制基于JAVA的B/S业务系统 重量级企业在线自定义WEB报表平台 Excel制表、零代码发布、打印、图表结合——快逸报表,免费、稳定、功能强大的java工具 技术圈: 关于Java、dotNet、PHP、Ruby、奇客、Web2.0等更多资讯和博客精选文章 首页 | 动态 | 文章 | FAQ | 新闻 | 下载 | 代码 | 工作 | 调查 | 术语 | 站点 | 图书 | 论坛 | 帮助 | 全部
TOP | 交流 | 软件 | 专栏 | 开源 | 译/著 | 源码 | API | 推荐 | FTP | 积分 | 统计 | 搜索 | Blog | 我们
首页»研究文集»Java入门 搜索标题相关文章 发表评论 开始监控 加入收藏夹 java 与 mysql 中文问题的处理 wojiushiwoltq 转贴 更新:2008-11-09 17:17:34 版本: 1.0
java 与 mysql 中文问题的处理
--------------------------------------------------------------------------------
2005-08-01 来源:CSDN 作者:kengking
问题:用 jdbc 插入、读取数据库种文字串乱码。
首先,mysql 数据库中的东西都是二进制存放的,支持任何数据,当然包括中文。你到命令行下
insert into testtable values ( '中文' );
select * from testtable;
全都显示正常。
但是,虽然存取中文没问题,但排序、匹配的时候有问题。所以如果你的数据库里有中文的话,记得在配置文件中,如 c:winntmy.ini 中的 [mysqld] 里添加一行:
default-character-set=gbk
然后重启 mysql server 。 注意 gbk 要小写,不然 mysqld 启动不了。
其次,数据库没问题,下面看看 java 程序。在程序里很无聊地加一句调试语句:
out.println("中文");
也显示正常,说明整个 java 环境没问题。
所以,当然是联系 java 和 mysql 的部分,mysql jdbc driver 出问题了。
分析一下,java 内部使用 unicode ,而 mysql 缺省使用 iso-8xxx(忘了),所以 jdbc driver 把查询字符串传给 mysql server 时,会做 unicode->iso-8xxx 的转换,从 mysql server 接受结果时,会做 iso-8xxx->unicode 的转换。(在屏幕上显示结果时会 unicode->GBK,不过不关这里的事。)
这就有问题了,我在命令行下插入数据库的中文字符串是 GBK (这是简体中文 windows 的默认),所以 jdbc driver 接受查询结果时,应该做 GBK->unicode 的转换才对。
验证一下,对从数据库中读出的中文字串 s ,
new String( s.getByte("iso-8xxx"), "gbk" )
将 s 先做一个 unicode->iso-8xxx 转换成它存放在数据库中的原始模样。我们知道它是 gbk ,所以手工来 gbk->unicode ,这样 java 程序就显式正常了。
类似,写入数据库的时候,我们期待 jdbc driver 会把 unicode->gbk ,结果却是 unicode->iso-8xxx ,当然是乱码了。
有很多文章,就到此为止,并告诉我们:要解决中文问题,自己手工转码吧。
这实在是不负责任。如果每一个字符串都要手工转码,说明程序设计出了问题。
想一想,写 mysql jdbc driver 的家伙会连转码都不知道?
所以我看看 connector-j-3.0.7 里面的 readme, 找到一个解决方案:
connection = DriverManager.getConnection( "jdbc:mysql://localhost/test?user=root&password=&useUnicode=true&characterEncoding=GBK" );
这是告诉 jdbc driver 强制按指定参数转码
其实还是有问题。如果 mysql server 一定得用 iso-8xxx ,那就只有用上一个办法了。但我记得我的 mysql 是 gbk ,不是都改过 my.ini 了吗? jdbc driver 怎么都不自动探测 mysql server 的字符集呢?
这个时候就看到开放源码的好处了 :-) connector-j-3.0.7 源码中确实有代码读取 mysql server 的信息,包括字符集。从注释中知道,
作者为 unicode 转换到单字节字符集写了自己的转换函数,并号称比 jvm 的快百分之多少多少。所以代码中有一段,判段数据库如果使用的是单字节就调用自己的转换函数。但这段代码后面就忘了把多字节字符集交给 jvm 去转换了,所以变成了缺省的 iso-8xxx 转换。
我的修改方式: commysqljdbcConnecter.java 这个文件的 1969 行,
this.doUnicode = true; // force the issue
将之上移四行到 1964 行,放在下面这一行的前面:
try {
用这份代码重新编出来的 jdbc driver ,你的 java 访问数据库的程序不用做任何修改就可以正确读写中文了,不过要记得 mysql server 要 default-character-set=gbk
我使用它测试了几个小程序,中文都显示正常,而且都没死机、异常。呵呵,自我感觉很好。
<script type="text/javascript"><!--google_ad_client = "pub-7390275636631344";google_ad_width = 728;google_ad_height = 90;google_ad_format = "728x90_as";google_ad_type = "text_image";google_ad_channel ="5095444487";google_color_border = "336699";google_color_bg = "FFFFFF";google_color_link = "0000FF";google_color_url = "008000";google_color_text = "000000";//--></script><script type="text/javascript" src="http://pagead2.googlesyndication.com/pagead/show_ads.js"></script><script>window.google_render_ad();</script><iframe name="google_ads_frame" src="http://pagead2.googlesyndication.com/pagead/ads?client=ca-pub-7390275636631344&dt=1227263447271&lmt=1226898890&format=728x90_as&output=html&correlator=1227263447271&channel=5095444487&url=http%3A%2F%2Fwww.javaresearch.org%2Farticle%2F158937.htm&color_bg=FFFFFF&color_text=000000&color_link=0000FF&color_url=008000&color_border=336699&ad_type=text_image&eid=30143001&ea=0&ref=http%3A%2F%2Fwww.javaresearch.org%2Findex.jsp&frm=0&ga_vid=1415829337.1227246962&ga_sid=1227263293&ga_hid=16815219&ga_fc=true&flash=10.0.12&u_h=900&u_w=1440&u_ah=870&u_aw=1440&u_cd=32&u_tz=480&u_his=1&u_nplug=10&u_nmime=35&dtd=4" marginwidth="0" marginheight="0" vspace="0" hspace="0" allowtransparency="true" scrolling="no" width="728" frameborder="0" height="90"></iframe>版权声明本篇文章对您是否有帮助? 投票:是 否 投票结果: 1 0
作者其它文章: java 与 mysql 中文问题的处理
--------------------------------------------------------------------------------
2005-08-01 来源:CSDN 作者:kengking
问题:用 jdbc 插入、读取数据库种文字串乱码。
首先,mysql 数据库中的东西都是二进制存放的,支持任何数据,当然包括中文。你到命令行下
insert into testtable values ( '中文' );
select * from testtable;
全都显示正常。
但是,虽然存取中文没问题,但排序、匹配的时候有问题。所以如果你的数据库里有中文的话,记得在配置文件中,如 c:winntmy.ini 中的 [mysqld] 里添加一行:
default-character-set=gbk
然后重启 mysql server 。 注意 gbk 要小写,不然 mysqld 启动不了。
其次,数据库没问题,下面看看 java 程序。在程序里很无聊地加一句调试语句:
out.println("中文");
也显示正常,说明整个 java 环境没问题。
所以,当然是联系 java 和 mysql 的部分,mysql jdbc driver 出问题了。
分析一下,java 内部使用 unicode ,而 mysql 缺省使用 iso-8xxx(忘了),所以 jdbc driver 把查询字符串传给 mysql server 时,会做 unicode->iso-8xxx 的转换,从 mysql server 接受结果时,会做 iso-8xxx->unicode 的转换。(在屏幕上显示结果时会 unicode->GBK,不过不关这里的事。)
这就有问题了,我在命令行下插入数据库的中文字符串是 GBK (这是简体中文 windows 的默认),所以 jdbc driver 接受查询结果时,应该做 GBK->unicode 的转换才对。
验证一下,对从数据库中读出的中文字串 s ,
new String( s.getByte("iso-8xxx"), "gbk" )
将 s 先做一个 unicode->iso-8xxx 转换成它存放在数据库中的原始模样。我们知道它是 gbk ,所以手工来 gbk->unicode ,这样 java 程序就显式正常了。
类似,写入数据库的时候,我们期待 jdbc driver 会把 unicode->gbk ,结果却是 unicode->iso-8xxx ,当然是乱码了。
有很多文章,就到此为止,并告诉我们:要解决中文问题,自己手工转码吧。
这实在是不负责任。如果每一个字符串都要手工转码,说明程序设计出了问题。
想一想,写 mysql jdbc driver 的家伙会连转码都不知道?
所以我看看 connector-j-3.0.7 里面的 readme, 找到一个解决方案:
connection = DriverManager.getConnection( "jdbc:mysql://localhost/test?user=root&password=&useUnicode=true&characterEncoding=GBK" );
这是告诉 jdbc driver 强制按指定参数转码
其实还是有问题。如果 mysql server 一定得用 iso-8xxx ,那就只有用上一个办法了。但我记得我的 mysql 是 gbk ,不是都改过 my.ini 了吗? jdbc driver 怎么都不自动探测 mysql server 的字符集呢?
这个时候就看到开放源码的好处了 :-) connector-j-3.0.7 源码中确实有代码读取 mysql server 的信息,包括字符集。从注释中知道,
作者为 unicode 转换到单字节字符集写了自己的转换函数,并号称比 jvm 的快百分之多少多少。所以代码中有一段,判段数据库如果使用的是单字节就调用自己的转换函数。但这段代码后面就忘了把多字节字符集交给 jvm 去转换了,所以变成了缺省的 iso-8xxx 转换。
我的修改方式: commysqljdbcConnecter.java 这个文件的 1969 行,
this.doUnicode = true; // force the issue
将之上移四行到 1964 行,放在下面这一行的前面:
try {
用这份代码重新编出来的 jdbc driver ,你的 java 访问数据库的程序不用做任何修改就可以正确读写中文了,不过要记得 mysql server 要 default-character-set=gbk
我使用它测试了几个小程序,中文都显示正常,而且都没死机、异常。呵呵,自我感觉很好。
<script type="text/javascript"><!--google_ad_client = "pub-7390275636631344";google_ad_width = 728;google_ad_height = 90;google_ad_format = "728x90_as";google_ad_type = "text_image";google_ad_channel ="5095444487";google_color_border = "336699";google_color_bg = "FFFFFF";google_color_link = "0000FF";google_color_url = "008000";google_color_text = "000000";//--></script><script type="text/javascript" src="http://pagead2.googlesyndication.com/pagead/show_ads.js"></script><script>window.google_render_ad();</script><iframe name="google_ads_frame" src="http://pagead2.googlesyndication.com/pagead/ads?client=ca-pub-7390275636631344&dt=1227263447271&lmt=1226898890&format=728x90_as&output=html&correlator=1227263447271&channel=5095444487&url=http%3A%2F%2Fwww.javaresearch.org%2Farticle%2F158937.htm&color_bg=FFFFFF&color_text=000000&color_link=0000FF&color_url=008000&color_border=336699&ad_type=text_image&eid=30143001&ea=0&ref=http%3A%2F%2Fwww.javaresearch.org%2Findex.jsp&frm=0&ga_vid=1415829337.1227246962&ga_sid=1227263293&ga_hid=16815219&ga_fc=true&flash=10.0.12&u_h=900&u_w=1440&u_ah=870&u_aw=1440&u_cd=32&u_tz=480&u_his=1&u_nplug=10&u_nmime=35&dtd=4" marginwidth="0" marginheight="0" vspace="0" hspace="0" allowtransparency="true" scrolling="no" width="728" frameborder="0" height="90"></iframe>版权声明
- Java中static、this、super、final用法简谈(三)
这个文章共有 0 条评论 上一篇文章 返回〔Java入门〕 下一篇文章
关于 JR | 版权声明 | 联系我们
©2002-2006 JR 版权所有 沪ICP备05019622号
- Java 与 mysql 中文问题的处理
- java 与 mysql 中文问题的处理
- java 与 mysql 中文问题的处理
- java 与 mysql 中文问题的处理
- java 与 mysql 中文问题的处理
- [转帖]Java 与 mysql 中文问题的处理
- Java链接Mysql中文乱码问题处理
- java与MySQL的连接与中文乱码问题
- mysql处理中文问题
- MySQL 的 source 命令处理中文问题
- mysql处理中文乱码的问题
- Mysql+java项目的中文处理
- 处理mysql数据库与hibernate中文乱码问题
- 关于java中的中文处理的问题
- mysql中文问题全处理
- Servlet MySQL中文处理问题
- MySQL处理中文乱码问题
- MySQL处理中文乱码问题
- 【数据加密】易懂易用的MD5加密(可直接运行)(2)
- 【数据加密】易懂易用的MD5加密(可直接运行) (1)
- 【数据加密】简单加密/解密方法包装
- 【数据加密】用DES加密字符串
- SQL Server 2005 Analysis Services实践(一)
- java 与 mysql 中文问题的处理
- SQL Server 2005 Analysis Services实践(二)
- 【算法】扑克发牌算法实现
- 统一维度模型简介[转]
- row_number()over函数的使用
- 软件工程师所需要的素质(原创)
- 商业智能应用中的数据挖掘[转]
- 程序员的成长
- asp.net 多文件上传