完整的ASCII码---(2)

来源:互联网 发布:房贷 知乎 编辑:程序博客网 时间:2024/04/25 09:49

因为1位二进制数可以表示(21=)2种状态:0、1;而2位二进制数可以表示(22)=4种状态:00、01、10、11;依次类推,7位二进制数可以表示(27=)128种状态,每种状态都唯一地编为一个7位的二进制码,对应一个字符(或控制码),这些码可以排列成一个十进制序号0~127。所以,7位ASCII码是用七位二进制数进行编码的,可以表示128个字符。
    第0~32号及第127号(共34个)是控制字符或通讯专用字符,如控制符:LF(换行)、CR(回车)、FF(换页)、DEL(删除)、BEL(振铃)等;通讯专用字符:SOH(文头)、EOT(文尾)、ACK(确认)等;
    第33~126号(共94个)是字符,其中第48~57号为0~9十个阿拉伯数字;65~90号为26个大写英文字母,97~122号为26个小写英文字母,其余为一些标点符号、运算符号等。


那128~255号何用?

"相比西方的拼音文字,东方的文字(如中文)的字符数要大得多,根本不可能在一个字节内将它们表示出来,因此,它们以两个字节为单位存储,以中文国标字符集 GB2312为例,它的第一个字节为128-255。系统可以据此判断,若第一个字节大于127,则把与该字节后紧接着的一个字节结合起来共两个字节组成一个中文字符。这种由多个字节存储一个字符的字符集叫多字节字符集(MultiByte Charsets),对应的象ASCII这种用一个字节存储一个字符的字符集叫单字节字符集(SingleByte Charsets)。在GB2312字符集中,ASCII字符仍然用一个字节存储,换句话说该ASCII是该字符集的子集。"(本人自己加的,不知道有没有理解错误)


    注意:在计算机的存储单元中,一个ASCII码值占一个字节(8个二进制位),其最高位(b7)用作奇偶校验位。所谓奇偶校验,是指在代码传送过程中用来检验是否出现错误的一种方法,一般分奇校验和偶校验两种。奇校验规定:正确的代码一个字节中1的个数必须是奇数,若非奇数,则在最高位b7添1;偶校验规定:正确的代码一个字节中1的个数必须是偶数,若非偶数,则在最高位b7添1。

代碼解釋 Dec:十進位 Hx:16進位 Oct:8進位 Char:字元
16進位表示法:0、1、2、3、4、5、6、7、8、9、A、B、C、D、E、F、10、11、12…1F、20…
Dec Hx Oct Char                        Dec Hx Oct Char  Dec Hx Oct Char  Dec Hx Oct Char
---------------                        ---------------  ---------------  ---------------
  0  0 000 NUL (null)                   32 20 040 SPACE  64 40 100 @      96 60 140 `
  1  1 001 SOH (start of heading)       33 21 041 !      65 41 101 A      97 61 141 a
  2  2 002 STX (start of text)          34 22 042 "      66 42 102 B      98 62 142 b
  3  3 003 ETX (end of text)            35 23 043 #      67 43 103 C      99 63 143 c
  4  4 004 EOT (end of transmission)    36 24 044 ___FCKpd___1nbsp;     68 44 104 D     100 64 144 d
  5  5 005 ENQ (enquiry)                37 25 045 %      69 45 105 E     101 65 145 e
  6  6 006 ACK (acknowledge)            38 26 046 &      70 46 106 F     102 66 146 f
  7  7 007 BEL (bell)                   39 27 047 '      71 47 107 G     103 67 147 g
  8  8 010 BS  (backspace)              40 28 050 (      72 48 110 H     104 68 150 h
  9  9 011 TAB (horizontal tab)         41 29 051 )      73 49 111 I     105 69 151 i
10  A 012 LF  (NL line feed, new line) 42 2A 052 *      74 4A 112 J     106 6A 152 j
11  B 013 VT  (vertical tab)           43 2B 053 +      75 4B 113 K     107 6B 153 k
12  C 014 FF  (NP form feed, new page) 44 2C 054 ,      76 4C 114 L     108 6C 154 l
13  D 015 CR  (carriage return)        45 2D 055 -      77 4D 115 M     109 6D 155 m
14  E 016 SO  (shift out)              46 2E 056 .      78 4E 116 N     110 6E 156 n
15  F 017 SI  (shift in)               47 2F 057 /      79 4F 117 O     111 6F 157 o
16 10 020 DLE (data link escape)       48 30 060 0      80 50 120 P     112 70 160 p
17 11 021 DC1 (device control 1)       49 31 061 1      81 51 121 Q     113 71 161 q
18 12 022 DC2 (device control 2)       50 32 062 2      82 52 122 R     114 72 162 r
19 13 023 DC3 (device control 3)       51 33 063 3      83 53 123 S     115 73 163 s
20 14 024 DC4 (device control 4)       52 34 064 4      84 54 124 T     116 74 164 t
21 15 025 NAK (negative acknowledge)   53 35 065 5      85 55 125 U     117 75 165 u
22 16 026 SYN (synchronous idle)       54 36 066 6      86 56 126 V     118 76 166 v
23 17 027 ETB (end of trans. block)    55 37 067 7      87 57 127 W     119 77 167 w
24 18 030 CAN (cancel)                 56 38 070 8      88 58 130 X     120 78 170 x
25 19 031 EM  (end of medium)          57 39 071 9      89 59 131 Y     121 79 171 y
26 1A 032 SUB (substitute)             58 3A 072 :      90 5A 132 Z     122 7A 172 z
27 1B 033 ESC (escape)                 59 3B 073 ;      91 5B 133 [     123 7B 173 {
28 1C 034 FS  (file separator)         60 3C 074 <      92 5C 134 /     124 7C 174 |
29 1D 035 GS  (group separator)        61 3D 075 =      93 5D 135 ]     125 7D 175 }
30 1E 036 RS  (record separator)       62 3E 076 >      94 5E 136 ^     126 7E 176 ~
31 1F 037 US  (unit separator)         63 3F 077 ?      95 5F 137 _     127 7F 177 DEL
 

The following document lists the control characters in Ascii and in
newer character code standards like Unicode, which try to be compatible
with Ascii in the Ascii code range (positions 0 through 127).