ascii码字符表, 扩展的ascii码字符表, html码, 扫描码, 广义二进制编码的十进制交换码(EBCDIC), Unicode

来源:互联网 发布:fzqkbysjw gb1 0mac 编辑:程序博客网 时间:2024/05/17 05:52
 
1.ASCII码字符表

        ASCII码即美国标准信息交换码(American Standard Code for Information Interchange),计算机只能理解数字,因此一个ASCII码就是一个字符, 如:'a' 或 '@' 的数字表现形式,也可表示某种动作。ASCII码出现较早,非打印字符的使用也不再出于最初的目的。以下是ASCII码字符表,其中包括对前32个非打印字符的描述。当初设计ASCII码实际上是为了使用电传打字机,因此这些描述不好理解。如果有人说想要你的成绩单,但要用ASCII格式,这就意味着他们只想要不带诸如加粗,下划线等格式的纯文本 - 也就是计算能理解的最原始的格式。这样就比较容易输入计算机进行处理。记事本可以创建ASCII码文本,在Word中你也可以把文件保存为纯文本。
 
        第0~32号及第127号(共34个)是控制字符或通讯专用字符,如控制符:LF(换行)、CR(回车)、FF(换页)、DEL(删除)、BEL(振铃)等;通讯专用字符:SOH(文头)、EOT(文尾)、ACK(确认)等;

    第33~126号(共94个)是字符,其中第48~57号为0~9十个阿拉伯数字;65~90号为26个大写英文字母,97~122号为26个小写英文字母,其余为一些标点符号、运算符号等。

    注意:在计算机的存储单元中,一个ASCII码值占一个字节(8个二进制位),其最高位(b7)用作奇偶校验位。所谓奇偶校验,是指在代码传送过程中用来检验是否出现错误的一种方法,一般分奇校验和偶校验两种。奇校验规定:正确的代码一个字节中1的个数必须是奇数,若非奇数,则在最高位b7添1;偶校验规定:正确的代码一个字节中1的个数必须是偶数,若非偶数,则在最高位b7添1。

 常规字符集(regular ascii codes)


Bin              Dec      Hex           缩写/字符                                    解释
0000 0000    0          00            NUL (null)                                  空字符   
0000 0001    1          01            SOH (start of handing)                 标题开始  
0000 0010    2          02            STX (start of text)                      正文开始  
0000 0011    3          03            ETX (end of text)                        正文结束
0000 0100    4          04            EOT (end of transmission)             传输结束  
0000 0101    5          05            ENQ (enquiry)                             请求  
0000 0110    6          06            ACK (acknowledge)                      收到通知  
0000 0111    7          07            BEL (bell)                                   响铃
0000 1000    8          08            BS (backspace)                          退格  
0000 1001    9          09            HT (horizontal tab)                      水平制表符  
0000 1010    10        0A            LF (NL line feed, new line)             换行键  
0000 1011    11        0B            VT (vertical tab)                          垂直制表符  
0000 1100    12        0C            FF (NP form feed, new page)         换页键  
0000 1101    13        0D            CR (carriage return)                     回车键
0000 1110    14        0E            SO (shift out)                              不用切换  
0000 1111    15        0F            SI (shift in)                                 启用切换  
0001 0000    16        10            DLE (data link escape)                  数据链路转义  
0001 0001    17        11            DC1 (device control 1)                  设备控制1  
0001 0010    18        12            DC2 (device control 2)                  设备控制2  
0001 0011    19        13            DC3 (device control 3)                  设备控制3  
0001 0100    20        14            DC4 (device control 4)                  设备控制4  
0001 0101    21        15            NAK (negative acknowledge)         拒绝接收  
0001 0110    22        16            SYN (synchronous idle)                 同步空闲  
0001 0111    23        17            ETB (end of trans. block)              传输块结束  
0001 1000    24        18            CAN (cancel)                               取消
0001 1001    25        19            EM (end of medium)                      介质中断  
0001 1010    26        1A            SUB (substitute)                          替补  
0001 1011    27        1B            ESC (escape)                              溢出  
0001 1100    28        1C            FS (file separator)                       文件分割符  
0001 1101    29        1D            GS (group separator)                    分组符  
0001 1110    30        1E            RS (record separator)                   记录分离符  
0001 1111    31        1F            US (unit separator)                      单元分隔符 



 扩展字符集(extended ascii codes)


 ASCII(0-255)码字符表



2.HTML码

        HTML码与ASCII无关。为了把特殊字符显示在HTML Web页面上,对这些字符编号以使浏览器能解释这些特殊字符

  HTML码(HTML codes)




3.扫描码


        扫描码同样与ASCII无关。程序员经常利用扫描码让键盘与软件交互。

  扫描码(scan codes)




4.广义二进制编码的十进制交换码(EBCDIC)


 EBCDIC码(Extended Binary Coded Decimal Interchange Code)




5.Unicode表(第四版)

        ASCII码比较简单,因此被许多生产商进行扩展。计算机在世界上的广泛使用使得有必要用其它符号来显示日语,汉语等语言。Unicode试图标准化每一个可能的字符。以下是Unicode的最新版本-第四版。

GeneralBasic LatinLatin-1 SupplementLatin Extended-ALatin Extended-BLatin Extended AdditionalIPA ExtensionsPhonetic ExtensionsArabicArmenianBengaliBuhidCanadian Aboriginal SyllabicsCherokeeCypriot SyllabaryCyrillicCyrillic SupplementaryDeseretDevanagariEthiopicGeorgianGothicGreek and CopticGreek ExtendedGujaratiGurmukhiHanun

原创粉丝点击