关于编码转换

来源:互联网 发布:mac photoshop cc 2016 编辑:程序博客网 时间:2024/06/05 10:51
今天编译c++代码输出一个中文字符串で时候没有输出 ,因此总结了一下字符编码的过程。     编写源代码时,文件首地址0xfffe代表该文件的编码为UNICODE,因此在编译时遇到的源代码正常情况下按照UNICODE编码处理。     如果没有,则编译器将 '我' 的UNICODE编码转换为'GB2312'编码,输出时只要该字符在GB2312字符集中存在,便能正常显示。     代码运行时,输出字符编码时会到代码中设置好的字符集(字符集的选择在一个全局变量中,该全局变量控制字符寻找字符集的通路)中去寻找字符,如果没有设置字符集,则去寻找默认的字符库中去寻找,在printf输出时识别字符的编码,字符集获取字符形状,根据光标位置显示字符串。     所以,当有中文时,如果字符库为ascii库,自然找不到中文,当源文件编码为UNICODE时(比如字符常量前加‘L’),编译器将字符库设置为GB3212,则可能会无字符输出或者乱码。

参考:blog.sina.com.cn/s/blog_4d8b08a10100h8h5.html

0 0
原创粉丝点击