编码格式
来源:互联网 发布:修身夹克 知乎 编辑:程序博客网 时间:2024/05/20 10:20
1、ASCII(American Standard Code for Information Interchange,美国信息交换标准代码)
7bit,共128个字符
2、ISO8859-1编码:通常叫做Latin-1。 8bit,共256个字符。 mysql中经常使用Latin-1
3、UTF-8 1-3字节
4、GBK GB2312的超集,双字节。
5、ANSI编码(American National Standards Institute 美国国家标准学会组织)
微软虚构的一种编码格式。
话说计算机是由美国佬搞出来的嘛,他们觉得一个字节(可以表示256个编码)表示英语世界里所有的字母、数字和常用特殊符号已经绰绰有余了(其实ASCII只用了前127个编码)。后来欧洲人不干了,法国人说:我需要在小写字母加上变音符号(如:é),德国人说:我也要加几个字母(Ä ä、Ö ö、Ü ü、ß)。于是,欧洲人就将ASCII没用完的编码(128-255)为自己特有的符号编码(后来称之为“扩展字符集”)。等到我们中国人开始使用计算机的时候,尼玛,256个编码哪够?我泱泱大中华,汉字起码也得N多万吧,就连小学生都得要求掌握两三千字。国标局最后拍板:一个字节不够,那我们就用多个字节来为汉字编码吧,但是,国情那么穷,字节那么贵,三个字节伤不起,那就用俩字节吧,先给常用的几千汉字编个码,等以后国家强盛了人民富裕了,咱再扩展呗---于是GB2312就产生了。台湾同胞一看,尼玛,全是简体字,还让不让我们写繁体字的活了,于是台湾同胞也自己弄了个繁体字编码---大五码(Big-5)。同时,其它国家也在为自己的文字编码。最后,微软苦逼了:顾客就是上帝啊,你们的编码我都得满足啊,这样吧,卖给美国国内的系统默认就用ASCII编码吧,卖给中国人的系统默认就用GBK编码吧,卖给韩国人的系统默认就用EUC-KR编码,...但是为了避免你们误会我卖给你们的系统功能有差异,我就统一把你们的默认编码都显示成ANSI吧。---本故事纯属虚构,但“ANSI编码”确实只存在于Windows系统。
那么Windows系统是如何区分ANSI背后的真实编码的呢?
微软用一个叫“Windows code pages”(在命令行下执行chcp命令可以查看当前code page的值)的值来判断系统默认编码,比如:简体中文的code page值为936(它表示GBK编码,win95之前表示GB2312,详见:Microsoft Windows' Code Page 936),繁体中文的code page值为950(表示Big-5编码)。
- 编码格式
- 编码格式
- 编码格式
- 编码格式
- 编码格式
- 编码格式
- 编码格式
- 编码格式
- 编码格式
- 编码格式
- 编码格式
- 编码格式
- 编码格式
- 编码格式
- 编码格式
- 编码与编码格式?
- 容器格式和编码格式
- VBScript编码规范格式
- Oracle 重复数据查询以及删除
- Python异常处理机制
- Android文档Training之Fragment
- 矩阵乘法测试
- 欢迎使用CSDN-markdown编辑器
- 编码格式
- 99%用错销售技巧笔记
- js兼容性问题
- 5-12 排序 (25分)
- 2.28
- Linux进程间通信——使用消息队列
- 《论文排版札记》part 4 论文中插入参考文献
- SQL数据操作语言的使用
- 设置开机启动