sourceinsight显示中文乱码解决

来源：互联网发布：最佳作息时间知乎编辑：程序博客网时间：2024/05/20 05:25

linux console下面默认输入字符格式是UTF-8的。

SourceInsight默认支持ANSI格式。所以要先转换编码。

source insight 阅读Linux源码，注释为乱码解决方案

1、用记事本打开源文件，中文可以显示，我另存为，在保存选项中，编码一栏发现是：UTF-8。我选在ANSI一项，保存。再用Source Insight 打开，终于可以显示了。

ANSI编码:

不同的国家和地区制定了不同的标准，由此产生了 GB2312、GBK、Big5、Shift_JIS 等各自的编码标准。这些使用 1 至 4 个字节来代表一个字符的各种汉字延伸编码方式，称为 ANSI 编码。在简体中文Windows操作系统中，ANSI 编码代表 GBK 编码；在日文Windows操作系统中，ANSI 编码代表 Shift_JIS 编码。不同 ANSI 编码之间互不兼容，当信息在国际间交流时，无法将属于两种语言的文字，存储在同一段 ANSI 编码的文本中。当然对于ANSI编码而言，0x00~0x7F之间的字符，依旧是1个字节代表1个字符。这一点是ANSI编码与Unicode编码之间最大也最明显的区别。

为使计算机支持更多语言，通常使用 0x80~0xFF 范围的多个字节来表示 1 个字符。比如：汉字 '中' 在简体中文Windows操作系统中，使用 [0xD6,0xD0] 这两个字节存储。对于ANSI编码而言，0x00~0x7F之间的字符，依旧是1个字节代表1个字符。这一点是ANSI编码与UTF-16编码之间最大也最明显的区别。比如“A君是第131号”，在ANSI编码中，占用12个字节，而在UTF-16编码中，占用16个字节。因为A和1、3、1这4个字符，在ANSI编码中只各占1个字节，而在UTF-16编码中，是需要各占2个字节的。

0 1