校验码

来源：互联网发布：手机淘宝复制链接编辑：程序博客网时间：2024/04/30 23:57

海明码是一种多重(复式)奇偶检错系统。它将信息用逻辑形式编码，以便能够检错和纠错。用在海明码中的全部传输码字是由原来的信息和附加的奇偶校验位组成的。每一个这种奇偶位被编在传输码字的特定位置上。实现得合适时，这个系统对于错误的数位无论是原有信息位中的，还是附加校验位中的都能把它分离出来。

推导并使用长度为m位的码字的海明码，所需步骤如下：

1、确定最小的校验位数k，将它们记成D1、D2、…、Dk，每个校验位符合不同的奇偶测试规定。

2、原有信息和k个校验位一起编成长为m+k位的新码字。选择k校验位（0或1）以满足必要的奇偶条件。

3、对所接收的信息作所需的k个奇偶检查。

4、如果所有的奇偶检查结果均为正确的，则认为信息无错误。

如果发现有一个或多个错了，则错误的位由这些检查的结果来唯一地确定。

校验位数的位数

推求海明码时的一项基本考虑是确定所需最少的校验位数k。考虑长度为m位的信息，若附加了k个校验位，则所发送的总长度为m+k。在接收器中要进行k个奇偶检查，每个检查结果或是真或是伪。这个奇偶检查的结果可以表示成一个k位的二进字，它可以确定最多2k种不同状态。这些状态中必有一个其所有奇偶测试试都是真的，它便是判定信息正确的条件。于是剩下的（2^k-1）种状态，可以用来判定误码的位置。于是导出下一关系：

2^k-1≥m+k

码字格式

从理论上讲，校验位可放在任何位置，但习惯上校验位被安排在1、2、4、8、…的位置上。

图5列出了m=4，k=3时，信息位和校验位的分布情况。

码字位置	B₁	B₂	B₃	B₄	B₅	B₆	B₇
校验位	x	x		x
信息位			x		x	x	x
复合码字	P₁	P₂	D₁	P₃	D₂	D₃	D₄

图5 海明码中校验位和信息位的定位

循环冗余校验码（Cyclic Redundancy Check CRC)是常用的校验码，在早期的通信中运用广泛，因为早期的通信技术不够可靠（不可靠性的来源是通信技术决定的，比如电磁波通信时受雷电等因素的影响），不可靠的通信就会带来‘确认信息’的困惑，书上提到红军和蓝军通信联合进攻山下的敌军的例子，第一天红军发了条信息要蓝军第二天一起进攻，蓝军收到之后，发一条确认信息，但是蓝军担心的是‘确认信息’如果也不可靠而没有成功到达红军那里，那自己不是很危险？于是红军再发一条‘对确认的确认信息’，但同样的问题还是不能解决，红军仍然不敢冒然行动。

对通信的可靠性检查就需要‘校验’，校验是从数据本身进行检查，它依靠某种数学上约定的形式进行检查，校验的结果是可靠或不可靠，如果可靠就对数据进行处理，如果不可靠，就丢弃重发或者进行修复。

CRC码是由两部分组成，前部分是信息码，就是需要校验的信息，后部分是校验码，如果CRC码共长n个bit，信息码长k个bit，就称为(n,k)码。它的编码规则是：

首先将原信息码(kbit)左移r位(k+r=n)
运用一个生成多项式g(x)（也可看成二进制数）用模2除上面的式子，得到的余数就是校验码。
非常简单，要说明的：模2除就是在除的过程中用模2加，模2加实际上就是我们熟悉的异或运算，就是加法不考虑进位，公式是：

0+0=1+1=0,1+0=0+1=1
即‘异’则真，‘非异’则假。

由此得到定理：a+b+b=a 也就是‘模2减’和‘模2加’直值表完全相同。

有了加减法就可以用来定义模2除法，于是就可以用生成多项式g(x)生成CRC校验码。

例如： g(x)=x4+x3+x2+1,(7,3)码,信息码110产生的CRC码就是：

101
11101 | 110,0000

        111 01

        1 0100

        1 1101

        1001
余数是1001，所以CRC码是110,1001

标准的CRC码是，CRC-CCITT和CRC-16，它们的生成多项式是：

CRC-CCITT=x16+x12+x5+1
CRC-16=x16+x15+x2+1

校验位的确定

下面为我增加，意在提出编码方法以助理解（但编码是否主要标准不可知）

每行的值等于数值为1的各位码相异或。

如m=4,k=3.数据位前三行，校验位为后三行。即

A=p₁⊕D₁⊕D₃⊕D₄=0 得P₁=D₁⊕D₃⊕D₄

B=P₂⊕D₂⊕D₃⊕D₄=0 得P₂=D₂⊕D₃⊕D₄

C=P₃⊕D₁⊕D₂⊕D₃⊕D₄=0 得P₃=D₁⊕D₂⊕D₃⊕D_{4 以下计算访求同下}

k个校验位是通过对m+k位复合码字进行奇偶校验而确定的。

其中：P₁位负责校验海明码的第1、3、5、7、…（P₁、D₁、D₂、D₄、…）位，（包括P₁自己）

P₂负责校验海明码的第2、3、6、7、…（P₂、D₁、D₃、D₄、…）位，（包括P₂自己）

P₃负责校验海明码的第4、5、6、7、…（P₃、D₂、D₃、D₄、…）位，（包括P₃自己）

对m=4，k=3，偶校验的例子，只要进行式次偶性测试。这些测试（以A、B、C表示）在图6所示各位的位置上进行。

奇偶条件

码字位置

图6 奇偶校验位置

因此可得到三个校验方程及确定校验位的三个公式：

A=B₁⊕B₃⊕B₅⊕B₇=0 得P₁=D₁⊕D₂⊕D₄

B=B₂⊕B₃⊕B₆⊕B₇=0 得P₂=D₁⊕D₃⊕D₄

C=B₄⊕B₅⊕B₆⊕B₇=0 得P₃=D₂⊕D₃⊕D₄

若四位信息码为1001，利用这三个公式可求得三个校验位P₁、P₂、P₃值。和海明码，

上面是发送方的处理

在接收方，也可根据这三个校验方程对接收到的信息进行同样的奇偶测试：

A=B₁⊕B₃⊕B₅⊕B₇=0；

B=B₂⊕B₃⊕B₆⊕B₇=0；

C=B₄⊕B₅⊕B₅⊕B₇=0。

若三个校验方程都成立,即方程式右边都等于0，则说明没有错。若不成立即方程式右边不等于0，说明有错。从三个方程式右边的值，可以判断那一位出错。例如，如果第3位数字反了，则C=0(此方程没有B₃），A=B=1（这两个方程有B₃）。可构成二进数CBA，以A为最低有效位，则错误位置就可简单地用二进数CBA=011指出。

同样，若三个方程式右边的值为001，说明第1位出错。若三个方程式右边的值为100，说明第4位出错。

海明码的码距应该是3，所以能纠正1位出错。而奇偶校验码的码距才是2，只能发现1位出错，但不能纠正（不知道那一位错）。无校验的码距是1，它出任何一位出错后还是合法代码，所以也就无法发现出错。

这是关于海明码的经典说法，即码距为3，可以发现2位，或者纠正1位错。应满足2^k-1≥m+k。

但在清华的王爱英主编的《计算机组成与结构》（该书已成为国内的权威）中还提出了一种码距为4的海明码，可以发现2位，并且纠正1位错。应满足2^(k-1)≥m+k。

由于王爱英书上对这两种概念没有很仔细解释（特别对码距为3的海明码），过渡很突然。有些书简单抄袭时没有仔细消化，所以出现一些概念错。对于一般码距为3的海明码，应该是“可以发现2位，或者纠正1位错”，而不是“可以发现2位，并且纠正1位错”。在试题中出现过类似的错误。

若四位信息码为1001，利用这三个公式可求得三个校验位P₁、P₂、P₃值。和海明码，如图7则表示了信息码为1001时的海明码编码的全部情况。而图8中则列出了全部16种信息（D₁D₂D₃D₄=0000～1111）的海明码。

码字位置	B₁	B₂	B₃	B₄	B₅	B₆	B₇
码位类型	P₁	P₂	D₁	P₃	D₂	D₃	D₄
信息码	-	-	1	-	0	0	1
校验位	0	0	-	1	-	-	-
编码后的海明码	0	0	1	1	0	0	1

图7 四位信息码的海明编码

P₁	P₂	D₁	P₃	D₂	D₃	D₄
0	0	0	0	0	0	0
1	1	0	1	0	0	1
0	1	0	1	0	1	0
1	0	0	0	0	1	1
1	0	0	1	1	0	0
0	1	0	0	1	0	1
1	1	0	0	1	1	0
0	0	0	1	1	1	1
1	1	1	0	0	0	0
0	0	1	1	0	0	1
1	0	1	1	0	1	0
0	1	1	0	0	1	1
0	1	1	1	1	0	0
1	0	1	0	1	0	1
0	0	1	0	1	1	0
1	1	1	1	1	1	1

图8 未编码信息的海明码

上面是发送方的处理

在接收方，也可根据这三个校验方程对接收到的信息进行同样的奇偶测试：

A=B₁⊕B₃⊕B₅⊕B₇=0；

B=B₂⊕B₃⊕B₆⊕B₇=0；

C=B₄⊕B₅⊕B₅⊕B₇=0。

同样，若三个方程式右边的值为001，说明第1位出错。若三个方程式右边的值为100，说明第4位出错。

这是关于海明码的经典说法，即码距为3，可以发现2位，或者纠正1位错。应满足2^k-1≥m+k。

0+0=1+1=0,1+0=0+1=1
即‘异’则真，‘非异’则假。

由此得到定理：a+b+b=a 也就是‘模2减’和‘模2加’直值表完全相同。

有了加减法就可以用来定义模2除法，于是就可以用生成多项式g(x)生成CRC校验码。

例如： g(x)=x4+x3+x2+1,(7,3)码,信息码110产生的CRC码就是：

101
11101 | 110,0000

        111 01

        1 0100

        1 1101

奇偶校验码是奇校验码和偶校验码的统称，是一种最基本的检错码。它是由n-1位信息元和1位校验元组成，可以表示成为（n，n-1）。如果是奇校验码，在附加上一个校验元以后，码长为n的码字中“1”的个数为奇数个；如果是偶校验码，在附加上一个校验元以后，码长为n的码字中“1”的个数为偶数个。设：如果一个偶校验码的码字用A=[an-1,an-2,…，a1,a0]表示，则：

式中为校验元，“+”为模二和（以后也这样表示，请注意）。式（1）通常被称为校验方程。利用式（1），由信息元即可求出校验元。另外，如果发生单个（或奇数个）错误，就会破坏这个关系式，因此通过该式能检测码字中是否发生了单个或奇数个错误。

奇偶校验码是一种有效地检测单个错误的方法，之所以将注意力集中在检（或纠）单个错，这主要是因为码字中发生单个错误的概率要比发生2个或多个错误的概率大得多。例如，n = 5的码字，如果码字中各码元的错误是互相独立，误码率为10-4，则错1、2、3、4和5位的概率分别为：5×10-4、10-7、10-11、10-16和10-20。由此可见，要检（或纠）错误，首先要解决单个错误，这样才抓住了主要矛盾。一般情况下用上述偶校验码来检出单个错误，检错效果是令人满意的，不仅如此，奇偶校验码的编码效率很高，R=(n-1)/n，随n增大而趋近于1。下面就给出以码长n＝5为例，利用表1列出全部偶校验码字.

在数字信息传输中，奇偶校验码的编码可以用软件实现，也可用硬件电路实现。图8-4(a)就是码长为5的偶校验码编码器。从图中可以看到，4位码元长的信息组，串行送入四级移位寄存器（输入定时缓冲器），同时经模二运算得到校验元，存入输出缓冲器末级，编码完成即可输出码字。接收端的检错电路如图1(b)所示。当一个接收码组B完全进入五级移存器内时，开关S立即接通，从而得到检错信号M=b4+b3+b2+b1+b0。如果接收码组B无错，B＝A，则M＝0；如果接收码组B有单个（或奇数个）错误，则M＝1。

image: bk064553j-2.jpg

image: bk064553j-3.jpg

1001
余数是1001，所以CRC码是110,1001

标准的CRC码是，CRC-CCITT和CRC-16，它们的生成多项式是：

CRC-CCITT=x16+x12+x5+1
CRC-16=x16+x15+x2+1