字符编码(一)
来源:互联网 发布:python高级编程最新版 编辑:程序博客网 时间:2024/06/05 16:25
字符编码(一)
字符必须编码后才能被计算机处理,计算机使用的缺省编码方式就是计算机的内码。早期的计算机使用七位ASCII编码,为了处理汉字,程序员设计了用于简体中文的GB2312和用于繁体中文的big5。
GB2312(1980年)共收录了7445个字符,包括6763个汉字和682个其他符号。汉字区内码范围高字节从B0-F7,低字节从A1-FE,占用的码位是72*94=6768。其中有5个空位D7FA-D7FE。
GB2312支持的汉字太少,1995年的汉字扩展规范GBK1.0收录了21886个字符,它分为汉字区和图形符号区。汉字区包括21003个字符。
从ASCII,GB2312到GBK,这些编码方法是向下兼容的,即同一个字符在这些方案中总是相同的编码,后来的标准支持更多的字符。在这些编码中,英文和中文可以统一地处理。区分中文编码的方法是高字节的最高位不为0。按照程序员的称呼,GB2312,GBK都属于双字节字符集(DBCS)。
2000年的GB18030是取代GBK1.0的正式国家标准,该标准共收录27484个汉字,同时还收录了蒙文、藏文和维吾尔文等主要的少数民族文字。从汉字字汇上说,GB18030在GB13000.1的20902个汉字的基础上,增加了CJK扩展A的6582个汉字(Unicode码0x3400-0x4db5),一共收录了27484个汉字。
0 0
- 字符编码(一)
- 字符集与字符编码(一)
- 字符编码(一)
- C++ 自然语言编码详解系列一(字符编码基础)
- 字符编码学习小记一
- 计算机字符编码详解一
- C++字符串完全指南 - Win32字符编码(一)
- C++字符串完全指南 - Win32字符编码(一)
- C++字符串完全指南 - Win32字符编码(一)
- C++字符串完全指南 - Win32字符编码(一)
- C++字符串完全指南 - Win32字符编码(一)
- C++字符串完全指南 - Win32字符编码(一)
- html中字符编码的确定算法(一)
- C++字符串完全指南 - Win32字符编码(一)(前言)
- 中文字符编码的相互转换(一)
- 字符编码与字库开发基本原理学习(一)
- JAVA IO(一)字符集与字符编码简介
- 字符编码 ASCII/ UNICODE/ Multi-Byte (一)
- memory prefetch浅析
- 【UIKit-110-6】#import <UIKit/UITableView.h>外观
- SQL改写, 聚合语句, left join 改写标量子查询
- 学生选课系统(1)-功能模块
- xUtils基本介绍
- 字符编码(一)
- 表达式求值
- 操作系统基础知识(一)
- Android性能调优利器StrictMode
- D. Three Logos (CF Round #322 (Div.2) 瞎搞 分情况)
- Java中wait()与sleep()的区别
- Java基础知识思维导图
- 【9.28】打卡
- 【static&extern,转载,绝佳】再谈下声明、定义、初始化、赋值和extern