记录一下C++和C#中的字符串处理与编码格式的问题

来源:互联网 发布:网页代码编写软件 编辑:程序博客网 时间:2024/06/11 15:35

下面是字符、字节、编码格式的基础知识:

http://www.regexlab.com/zh/encoding.htm


程序中涉及的会有几次的编码格式的转换:

1. 代码文本,字符串是按我们文本设定的编码方式保存的

2. 代码运行期间,字符串在内存中是以一种编码方式保存的

3. 代码如果产生字符串输出,输出到问题的字符串不同的IO类会产生不同编码方式的保存,当然这个可以设置实现更改


因为同一个字符串存在了3次的编码格式切换,所以这里3个地方的实际存储的字节长度会可能不一样。

另外如果对字符串进行字节流处理,要格外小心,不要确认具体的编码方式(汉字:Unicode编码 2字节, UTF8编码3字节,ANSI编码看具体的本地化编码)。

2 0
原创粉丝点击