字符集编码问题探索

来源:互联网 发布:吃饭 叫号软件 编辑:程序博客网 时间:2024/06/05 17:50

最近又一次被这个问题折腾的够呛,索性研究了一下,总结如下。

首先请参考文章《数据库字符集和编码转换》了解基本概念。

应用程序调用接口取到的字符串其实是按某种方式编码的(这是废话),以GBK编码为例。
如果调用的接口返回的是char*,那么可以直接显示和打印。注意:D5C5,C8FD分别为“张”和“三”的GBK内码。如图:
这里写图片描述

在这种情况下,QT使用toUnicode(GBK)或者fromLocal8Bit都可以还原字符串。

如果调用了Qt的数据库驱动,则返回值类型是QVariant。Qt的数据库驱动默认会将字符集设置为UTF-8。在我的例子中,由于取到的编码为GBK,所以我修改了QT的驱动,不进行UTF-8转化。所以QVariant中存的直接是GBK内码。如图:
这里写图片描述
QVariant和QString中直接存了GBK内码,当然无法直接显示。需要通过16进制转换(方法1)或者char转换(方法2),重新组织成QString才能正常显示。

附件:GBK编码查看器

1 0
原创粉丝点击