字符集和字符编码
来源:互联网 发布:ftp软件安卓 编辑:程序博客网 时间:2024/05/16 16:02
字符集和字符编码(Charset& Encoding)
2011-05-03 11:37 by 吴秦, 36787 visits, 收藏,编辑——每个软件开发人员应该无条件掌握的知识!
——Unicode伟大的创想!
相信大家一定碰到过,打开某个网页,却显示一堆像乱码,如"б?ЯАзЪСЯ"、"?????????"?还记得HTTP中的Accept-Charset、Accept-Encoding、Accept-Language、Content-Encoding、Content-Language等消息头字段?这些就是接下来我们要探讨的。
目录:
- 1.基础知识
- 2.常用字符集和字符编码
- 2.1. ASCII字符集&编码
- 2.2. GBXXXX字符集&编码
- 2.3. BIG5字符集&编码
- 3.伟大的创想Unicode
- 3.1.UCS & UNICODE
- 3.2.UTF-32
- 3.3.UTF-16
- 3.4.UTF-8
- 4.Accept-Charset/Accept-Encoding/Accept-Language/Content-Type/Content-Encoding/Content-Language
- 参考文献&进一步阅读
1.基础知识
计算机中储存的信息都是用二进制数表示的;而我们在屏幕上看到的英文、汉字等字符是二进制数转换之后的结果。通俗的说,按照何种规则将字符存储在计算机中,如'a'用什么表示,称为"编码";反之,将存储在计算机中的二进制数解析显示出来,称为"解码",如同密码学中的加密和解密。在解码过程中,如果使用了错误的解码规则,则导致'a'解析成'b'或者乱码。
字符集(Charset):是一个系统支持的所有抽象字符的集合。字符是各种文字和符号的总称,包括各国家文字、标点符号、图形符号、数字等。
字符编码(CharacterEncoding):是一套法则,使用该法则能够对自然语言的字符的一个集合(如字母表或音节表),与其他东西的一个集合(如号码或电脉冲)进行配对。即在符号集合与数字系统之间建立对应关系,它是信息处理的一项基本技术。通常人们用符号集合(一般情况下就是文字)来表达信息。而以计算机为基础的信息处理系统则是利用元件(硬件)不同状态的组合来存储和处理信息的。元件不同状态的组合能代表数字系统的数字,因此字符编码就是将符号转换为计算机可以接受的数字系统的数,称为数字代码。
2.常用字符集和字符编码
常见字符集名称:ASCII字符集、GB2312字符集、BIG5字符集、GB18030字符集、Unicode字符集等。计算机要准确的处理各种字符集文字,需要进行字符编码,以便计算机能够识别和存储各种文字。
- 字符集和字符编码
- 字符集和字符编码
- 字符集和字符编码
- 字符集和字符编码
- 字符集和字符编码
- 字符集和字符编码
- 字符集和字符编码
- 字符集和字符编码
- 字符集和字符编码
- 字符集和字符编码
- 字符集和字符编码
- 字符集和字符编码
- 字符集和字符编码
- 字符集和字符编码
- 字符集和字符编码
- 字符集和字符编码
- 字符集和字符编码
- 字符集和字符编码
- PHP扩展开发(4):函数返回值
- PHP扩展开发(5):参数声明
- PHP扩展开发(6):接收参数
- PHP扩展开发(7):zval结构
- mongoDB 与mysql 比速度
- 字符集和字符编码
- 【翻译】Iframe, onload 与 docume…
- lazyload for JQuery 滚屏图片加载…
- MySQL性能优化的最佳20+条经验
- PHP发送邮件乱码问题
- PHP验证码:随机扭曲、旋转、变形…
- PHP验证码:真正的随机正弦扭曲验…
- comet
- 微秒