Unicode码的定义和方法
来源:互联网 发布:产品如何做网络推广 编辑:程序博客网 时间:2024/05/21 04:21
定义:
Unicode码扩展自ASCII字元集。在严格的ASCII中,每个字元用7位元表示,或者电脑上普遍使用的每字元有8位元宽;而Unicode使用全16位元字元集。这使得Unicode能够表示世界上所有的书写语言中可能用於电脑通讯的字元、象形文字和其他符号。Unicode最初打算作为ASCII的补充,可能的话,最终将代替它。考虑到ASCII是电脑中最具支配地位的标准,所以这的确是一个很高的目标。
Unicode影响到了电脑工业的每个部分,但也许会对作业系统和程式设计语言的影响最大。从这方面来看,我们已经上路了。Windows NT从底层支援Unicode。
目前计算机中用得最广泛的字符集及其编码,是由美国国家标准局(ANSI)制定的ASCII码(American Standard Code for Information Interchange,美国标准信息交换码),它已被国际标准化组织(ISO)定为国际标准,称为ISO 646标准。适用于所有拉丁文字字母,ASCII码有7位码和8位码两种形式。
方法:
因为1位二进制数可以表示(2∧1=)2种状态:0、1;而2位二进制数可以表示(2∧2)=4种状态:00、01、10、11;依次类推,7位二进制数可以表示(2∧7=)128种状态,每种状态都唯一地编为一个7位的二进制码,对应一个字符(或控制码),这些码可以排列成一个十进制序号0~127。所以,7位ASCII码是用七位二进制数进行编码的,可以表示128个字符。
第0~32号及第127号(共34个)是控制字符或通讯专用字符,如控制符:LF(换行)、CR(回车)、FF(换页)、DEL(删除)、BEL(振铃)等;
通讯专用字符:SOH(文头)、EOT(文尾)、ACK(确认)等;
第33~126号(共94个)是字符,其中第48~57号为0~9十个阿拉伯数字;65~90号为26个大写英文字母,97~122号为26个小写英文字母,其余为一些标点符号、运算符号等。
注意:在计算机的存储单元中,一个ASCII码值占一个字节(8个二进制位),其最高位(b7)用作奇偶校验位。所谓奇偶校验,是指在代码传送过程中用来检验是否出现错误的一种方法,一般分奇校验和偶校验两种。奇校验规定:正确的代码一个字节中1的个数必须是奇数,若非奇数,则在最高位b7添1;偶校验规定:正确的代码一个字节中1的个数必须是偶数,若非偶数,则在最高位b7添1。
增添Unicode码内容:它前128个字符就是ASCII码,之后是扩展码。在它中,各个字符块基于同样的标准。其中有希腊字母,西里尔文,亚美尼亚文,希伯来文等。而汉文,韩语,日语的象形文字占用从0X3000到0X9FFF的代码。最杰出的地方是,它只有一个字符集,有效的避免了双字节字符集的二义性。缺点是:占用的内存空间比ASCII大2倍。
Unicode码:Unicode码也是一种国际标准编码,采用二个字节编码,与ASCII码不兼容。目前,在网络、Windows系统和很多大型软件中得到应用。
在Java中,字母指的是大写和小写的英文字母以及ASCII码大于128的所有字符。
Java编码使用的是Unicode编码而不是UTF-8编码,原因是Unicode是世界通用,更利于Java实现跨平台编写。
2 0
- Unicode码的定义和方法
- unicode环境下,CString 变量的定义和比较
- 方法的定义和使用
- prototype定义方法和this定义方法的区别
- 类方法的概述和定义方法
- CString与char*互转、ANSI 和 UNICODE 编码及_T和L宏定义的介绍
- javascript 对象的定义和方法的定义使用
- python的str,unicode对象的encode和decode方法
- python的str,unicode对象的encode和decode方法
- python的str,unicode对象的encode和decode方法
- python的str,unicode对象的encode和decode方法
- python的str,unicode对象的encode和decode方法
- python的str,unicode对象的encode和decode方法
- c# 类成员的定义 定义方法、字段和属性
- c# 类成员的定义 定义方法、字段和属性
- Unicode下 TCHAR* 和CString转string的一种方法
- 一个简单方便的ANSI和UNICODE互转方法
- js和php中对于unicode的正则表示方法
- Unity在xcode运行时报错问题line 2: /Users/sciyonSoft/Documents/APPCAN文档整理/ios/MapFileParser.sh: Permission de
- Linux调试工具
- JavaSE_10多线程
- 51822 如何输出.bin文件
- iOS常用公共方法
- Unicode码的定义和方法
- 程序员笔试(1)--数组和字符串
- 多层选项卡嵌套 , js选项卡tab , jquery选项卡
- [今日头条] 2017客户端工程师实习生笔试题
- 解决Linux和Windows双系统时间相差8小时的问题
- JavaSE_11常用类
- 题目1058:反序输出
- [leetcode] 394. Decode String 解题报告
- 添加文字水印