中文字符乱码
来源:互联网 发布:拓维信息怎么样 知乎 编辑:程序博客网 时间:2024/05/02 00:09
问: 当用JDBC向数据库中插入数据或从数据库中提取数据时,为何有时中文字符会显示为乱码?
答:
这个问题的实现通常与各个JDBC driver的实现有关. 目前大多数JDBC driver采用本地编码格式来传输中文字符,例如中文字符"0x4175"会被转成"0x41"和"0x75"进行传输. 因此我们需要对JDBC driver返回的字符以及要发给JDBC driver的字符进行转换.
当用JDBC driver向数据库中插入数据时,需要先将Unicode转成native code; 当 JDBC driver从数据库中查询数据时,则需要将native code转换成Unicode. 下面给出了这两种转换的实现:
String native2Unicode(String s) {
if (s == null || s.length() == 0) {
return null;
}
byte[] buffer = new byte[s.length()];
for (int i = 0; i s.length(); i++) { if (s.charAt(i)>= 0x100) {
c = s.charAt(i);
byte []buf = (""+c).getBytes();
buffer[j++] = (char)buf[0];
buffer[j++] = (char)buf[1];
}
else {
buffer[j++] = s.charAt(i);
}
}
return new String(buffer, 0, j);
}
除使用以上两个方法之外,有些JDBC driver如果对jdbc driver Manager设置了正确 的字符集属性,以上2个方法就不需要了.
windows记事本可以将文件内容保存为以下四种编码方式:
1、ANSI,不用说了
2、UNICODE,头两个字节内容为 0xFF 0xFE,对应为 UTF-16LE
3、UNICODE big endian,文字同样为UNICODE编码,只是字节顺序同2相反,以 0xFE 0xFF 开头,对应为 UTF-16BE
4、UTF-8,这种编码方式在<JAVA核心技术 I>上面有讲述,头三个字节为0xEF 0xBB 0xBF, 对应为 UTF-8
处理过程中先读出前三个字节内容判断出编码方式,然后再进行转换。
- MySQL中文字符乱码
- 中文字符乱码
- mysql中文字符乱码
- 中文字符乱码问题
- KEIL中文字符乱码
- QT 中文字符乱码
- 字符编码和中文乱码
- putty中文字符乱码问题
- ubuntu 中文字符乱码解决
- html中文字符乱码问题
- ubuntu字符界面中文乱码
- Python字符编码 中文乱码
- ubuntu字符界面中文乱码
- jsp中文字符乱码问题
- 中文字符乱码:UTF8、GB2312
- mysql存储中文字符乱码
- struts2解决中文字符乱码
- qt中文字符乱码问题
- 运用递归进行字符串的倒序排列
- Petshop 4.0学习-MasterPage.master文件
- oracle表被锁定后报"资源正忙",解锁方法
- SilverLight网站收藏
- 福布斯发布全球最具影响力女性百强
- 中文字符乱码
- 清除SQLSERVER2000暂挂项目
- boost::thread简要分析(2):线程同步
- 将VBSCRIPT与HTML结合一起响应事件
- 用C# 实现C/S模式下软件自动在线升级
- 运用递归 取某个目录下的所有子目录及文件
- Functor——bind
- boost::thread简要分析(3):线程局部存储及其它
- 递归 正整数分解