关于C#开发中那些编码问题
来源:互联网 发布:java date 格式化毫秒 编辑:程序博客网 时间:2024/06/15 23:10
最近一直在搞各种编码问题,略有心得,与大家分享一番。
System.Text提供了Encoding的抽象类,这个类提供字符串编码的方法。常用的编码方式主要有ASCII,Unicode,UTF8(Unicode编码的一种)。
Unicode有四种编码格式,UTF-8, UTF-16,UTF-32,UTF-7。
字符编码类,ASCIIEncoding ,UTF7Encoding,UnicodeEncoding,UTF32Encoding。
下面对ASCII和Unicode编码进行对比,废话不说,先上代码:
这是ASCII编码、解码。
http://blog.sina.com.cn/u/6272335754
http://blog.sina.com.cn/s/blog_175dc3f8a0102xgr6.html
http://blog.sina.com.cn/s/blog_175dc3f8a0102xgr5.html
http://blog.sina.com.cn/s/blog_175dc3f8a0102xgpo.html
http://blog.sina.com.cn/s/blog_175dc3f8a0102xgpp.html
http://blog.sina.com.cn/s/blog_175dc3f8a0102xgpr.html
http://blog.sina.com.cn/s/blog_175dc3f8a0102xgqa.html
http://blog.sina.com.cn/s/blog_175dc3f8a0102xgqb.html
http://blog.sina.com.cn/s/blog_175dc3f8a0102xgqc.html
http://blog.sina.com.cn/s/blog_175dc3f8a0102xgr2.html
http://blog.sina.com.cn/s/blog_175dc3f8a0102xgr4.html
![](http://images.cnblogs.com/OutliningIndicators/ContractedBlock.gif)
运行结果如下:
Original String:Hello World!
Bytes Array:48-65-6C-6C-6F-20-57-6F-72-6C-64-21
BigInteger:10334410032597741434076685640
Convert Back String:Hello World!
很正常,对吧?但是,如果输入的字符串是中文(或者其他非ASCII表中的字符),情况会怎么样呢?
改变上面的程序代码
string temp = "你好,世界!";
运行结果如下:
Original String:你好,世界!
Bytes Array:3F-3F-3F-3F-3F-3F
BigInteger:69540876599103
Convert
Back String:??????
如果把编码格式换成UTF8,依然重复上面的测试过程。
![](http://images.cnblogs.com/OutliningIndicators/ContractedBlock.gif)
运行结果如下:
Original String:你好,世界!
Bytes Array:E4-BD-A0-E5-A5-BD-EF-BC-8C-E4-B8-96-E7-95-8C-EF-BC-81
BigInteger:-10998968812899434720462615123889939386679836
Convert
Back String:你好,世界!
Original String:Hello World!
Bytes Array:48-65-6C-6C-6F-20-57-6F-72-6C-64-21
BigInteger:10334410032597741434076685640
Convert
Back String:Hello World!
通过对比,我们发现除了兼容中文和其他语言外,似乎没有太大区别。如果把编码集换成Unicode,中英文字符编码的不同就会很容易看出来了。
Original String:Hello World!
Bytes Array:48-00-65-00-6C-00-6C-00-6F-00-20-00-57-00-6F-00-72-00-6C-00-64-00-21-00
BigInteger:3160918205608148134863399242437668999277801104545742920
Convert
Back String:Hello World!
Original String:你好,世界!
Bytes Array:60-4F-7D-59-0C-FF-16-4E-4C-75-01-FF
BigInteger:-307722159543719876182061216
Convert
Back String:你好,世界!
如果不考虑其他情况。通过对比结果,我们发现:
1、ASCII只能处理英文和英文符号,具体请参考ASCII字符表
2、Unicode可以处理全球所有语言符号
3、Unicode处理英文时,会在每个字节后面加一个字节0x00,比ASCII多出一倍的长度;处理中文时,编码较短。
4、UTF8处理中文时比Unicode编码长,处理英文时与ASCII一样。
结论,由于现在存储介质越来越不值钱,在处理有非英文字符时,编码格式应该选择Unicode(或其子集UTF8等的任意一种编码格式),只有在确定程序只会处理英文的时候,才能选择ASCII编码。
- 关于C#开发中那些编码问题
- python3中关于编码那些事儿
- 关于网页中编码的那些事儿
- java中关于编码问题
- MYSQL中关于编码问题
- 关于eclipse中编码问题
- C#关于编码、解码相关问题
- CSS中关于定位的那些问题
- c#开发中的编码转换问题
- android开发中遇到的那些问题
- Android开发中那些问题(一)
- Android开发中那些问题(二)
- 关于计算机编码那些事儿
- 【C# HTTP】HttpWebRequest使用中编码问题
- 关于http接口开发中json格式数据编码问题处理
- 关于字符串编码的(ANSI、GB2312、UTF8)问题,在应用开发中若干问题
- javaweb开发中关于字符编码出现乱码问题的总结
- 关于java中url编码的问题
- 文章标题
- 分享一个白帽交流灵感的社区——先知技术安全社区
- Caffe从入门到精通07
- JS——Factory(工厂)模式
- 2017.11.3 关于C语言程序设计现代方法第9章第5题&&第8章第17题
- 关于C#开发中那些编码问题
- web.xml 中的listener、 filter、servlet 加载顺序及其详解
- 注解
- 基于C#的Http参数化请求工具
- 开发中 ios 11.0系统遇到的坑及解决办法
- IT连创业系列:说说苹果商店AppStore上架App应用前后遇到的那些神坑
- [贪心] Codeforces #545D. Queue
- Presto 集群管理工具
- 14. Longest Common Prefix