搞懂ASCII, ISO8859-1, ANSI和Unicode
来源:互联网 发布:大学生淘宝创业故事 编辑:程序博客网 时间:2024/06/05 10:53
ANSI(American National Standards Institute)字符集:
ASCII字符集+MBCS(Multi-Byte Character System)字符集,如GB2312。
ASCII: 最初,ANSI只包括一种字符集(ASCII-American Standard Code for Information Interchange)。ASCII码使用7bit表示一个字符,共128个字符。之后IBM在此基础上做了扩展,用8bit表示1个字符,共256个字符,称为ISO-8859-1字符集
MBCS: 为使计算机支持更多语言,这些派生的字符集通常使用 0x80~0xFF 范围的 2 个字节来表示 1 个字符. 汉字 '中' 在中文操作系统(使用ANSI编码)中,使用 [0xD6,0xD0] 这两个字节存储。在简体中文系统下,MBCS编码代表 GB2312 编码,在繁体中文系统中,MBCS编码代表BIG5,日文操作系统下,MBCS 编码代表 JIS 编码。
Unicode:由于ANSI字符集在不同语言环境下的不统一,导致字符集太多,国际交流中也需要进行字符集转换,带来很大不便。于是出现了unicode字符集。该字符集使用16bit代表一个字符,可表示65536个字符。使用Unicode字符集时,方法strlen对一个中文字符执行的结果是1。为了在网络上传输unicode字符,Unicode可以有多种编码方式,如UTF-16, UTF-8, UTF-32等
UTF-16: 标准的Unicode称为UTF-16(UCS Transformation System)。这种编码方式由于采用两个字节表示一个字符,所以与ASCII码不兼容
UTF-8: 为了双字节的unicode可在单字节系统正确传输,出现了UTF-8。通过UTF-8编码的字节长短不同,0-127范围内的字符被编成1个字节,0080-07ff的字符被编成2个字节,0800-ffff的字符被编成3个字节...
- 搞懂ASCII, ISO8859-1, ANSI和Unicode
- ANSI、ASCII和UNICODE
- ANSI、ASCII、Unicode和UTF-8编码
- ANSI、ASCII、Unicode和UTF-8编码
- ANSI、ASCII、Unicode和UTF-8编码
- 字符编码ASCII、Unicode、UTF-8、iso8859-1、GBK、GB2312
- 编码 ASCII ISO8859-1 GB2312 GBK GB18030 UNICODE UTF
- Unicode Ansi Ascii
- ANSI, ASCII , Unicode
- ANSI ASCII UNICODE
- ANSI ASCII UNICODE
- ANSI,ASCII,UNICODE
- Ascii、ANSI、unicode和utf-8的详解和区别
- 字符编码(一):ASCII,ANSI,Unicode和UTF-8
- unicode 和 utf-8 utf-16 utf-32 ASCII ANSI
- ANSI(ASCII字符集)和UNICODE(UTF8,UTF16 )
- Ansi,UTF8,Unicode,ASCII编码
- Ansi,UTF8,Unicode,ASCII编码
- hibernate源代码下载地址
- SQL Server 日期和时间函数
- java.lang.string.split 函数使用
- 关于图片缓存的问题
- 防止通过无参构造函数创建对象
- 搞懂ASCII, ISO8859-1, ANSI和Unicode
- oracle函数大全-字符处理函数
- JS动态添加HTML事件
- document.getElementsByTagName
- 服务器的诊断
- 索引失效
- 为何检测不到扫描仪
- Android SDK 目录结构
- strings.xml中定义字符串的使用方法