Visual Studio 2010中文版和GCC对C程序注释里中文的支持小结

来源：互联网发布：sqlserver mm dd 编辑：程序博客网时间：2024/05/17 03:21

写了一个只使用标准库函数的C程序，在其中用中文写了一些注释。在 Windows 7 中文版操作系统中，使用 Visual Studio 2010 中文版进行编译。为了测试 Visual Studio 2010 中文版对代码注释里中文的支持情况，使用 EditPlus，将 C 程序源文件转换成不同的编码方式，如下图：

试验一下采用不同编码方式的 C 源文件在 VS 2010 中文版中显示和编译是否正常，结果如下：

C源程序文件使用的编码在VS 2010中源文件的显示情况编译运行情况ANSI中文注释能正常显示，无乱码能编译，运行正常Unicode中文注释能正常显示，无乱码能编译，运行正常Unicode Big Endian中文注释能正常显示，无乱码能编译，运行正常UTF-8中文注释能正常显示，无乱码编译报错，不能正确识别源代码UTF-8 with BOM中文注释能正常显示，无乱码能编译，运行正常

由上表可以看出，除去采用不带 BOM 的 UTF-8 编码，VS 2010 中文版对于采用其他编码方式的源程序都能正确识别和编译。

---------------------------------------------------------------

再到 Linux 平台上看一下：

在 64 位 CentOS 6.8 上，将上面用到的采用不同编码方式 C 源文件使用 4.4.7 版本的 GCC 编译，结果如下：

C源程序文件使用的编码

使用GCC编译运行情况

ANSI能编译，运行正常UTF-8能编译，运行正常UTF-8 with BOM能编译，运行正常

Linux对 Unicode 的支持不好，因此没有必要对采用 Unicode、Unicode Big Endian这两种编码方式的源文件做测试。

由此可见：如果中文字符只是出现在 C 程序的注释中，并且该程序需要在 Windows、Linux 两种平台上编译，源文件在采用 ANSI、带 BOM 的 UTF-8 这两种编码方式中的任意一种的情况下，都能够编译和运行。但是如果源文件使用 ANSI 编码保存，在 VS 2010 中编译时，会出现如下的警告：

warning C4819: 该文件包含不能在当前代码页(936)中表示的字符。请将该文件保存为 Unicode 格式以防止数据丢失

因此最好将源文件以带 BOM 的 UTF-8 编码方式保存。

0 0