循环冗余校验码 CRC校验

来源：互联网发布：php个人信息管理系统编辑：程序博客网时间：2024/05/17 22:13

四、循环冗余校验码
在串行传送（磁盘、通讯）中，广泛采用循环冗余校验码（CRC）。CRC也是给信息码加上几位校验码，以增加整个编码系统的码距和查错纠错能力。
CRC的理论很复杂，一般书上只介绍已有生成多项式后计算校验码的方法。检错能力与生成多项式有关，只能根据书上的结论死记。
循环冗余校验码（CRC）的基本原理是：在K位信息码后再拼接R位的校验码，整个编码长度为N位，因此，这种编码又叫（N，K）码。对于一个给定的（N，K）码，可以证明存在一个最高次幂为N-K=R的多项式G(x)。根据G(x)可以生成K位信息的校验码，而G(x)叫做这个CRC码的生成多项式。
校验码的具体生成过程为：假设发送信息用信息多项式C(X)表示，将C(x)左移R位，则可表示成C(x)*2R，这样C(x)的右边就会空出R位，这就是校验码的位置。通过C(x)*2R除以生成多项式G(x)得到的余数就是校验码。
几个基本概念
1、多项式与二进制数码
多项式和二进制数有直接对应关系：x的最高幂次对应二进制数的最高位，以下各位对应多项式的各幂次，有此幂次项对应1，无此幂次项对应0。可以看出：x的最高幂次为R，转换成对应的二进制数有R+1位。
多项式包括生成多项式G(x)和信息多项式C(x)。
如生成多项式为G(x)=x4+x3+x+1，可转换为二进制数码11011。
而发送信息位 1111，可转换为数据多项式为C(x)=x3+x2+x+1。
2、生成多项式
是接受方和发送方的一个约定，也就是一个二进制数，在整个传输过程中，这个数始终保持不变。
在发送方,利用生成多项式对信息多项式做模2除生成校验码。在接受方利用生成多项式对收到的编码多项式做模2除检测和确定错误位置。
应满足以下条件：
a、生成多项式的最高位和最低位必须为1。
b、当被传送信息（CRC码）任何一位发生错误时，被生成多项式做模2除后应该使余数不为0。
c、不同位发生错误时，应该使余数不同。
d、对余数继续做模2除，应使余数循环。
将这些要求反映为数学关系是比较复杂的。但可以从有关资料查到常用的对应于不同码制的生成多项式如图9所示：
N K 码距d G(x)多项式 G(x)
7 4 3 x3+x+1 1011
7 4 3 x3+x2+1 1101
7 3 4 x4+x3+x2+1 11101
7 3 4 x4+x2+x+1 10111
15 11 3 x4+x+1 10011
15 7 5 x8+x7+x6+x4+1 111010001
31 26 3 x5+x2+1 100101
31 21 5 x10+x9+x8+x6+x5+x3+1 11101101001
63 57 3 x6+x+1 1000011
63 51 5 x12+x10+x5+x4+x2+1 1010000110101
1041 1024 　 x16+x15+x2+1 11000000000000101
图9 常用的生成多项式
3、模2除（按位除）
模2除做法与算术除法类似，但每一位除（减）的结果不影响其它位，即不向上一位借位。所以实际上就是异或。然后再移位移位做下一位的模2减。步骤如下：
a、用除数对被除数最高几位做模2减，没有借位。
b、除数右移一位，若余数最高位为1，商为1，并对余数做模2减。若余数最高位为0，商为0，除数继续右移一位。
c、一直做到余数的位数小于除数时，该余数就是最终余数。
【例】1111000除以1101：
1011———商
————
1111000-----被除数
1101———— 除数
————
010000
1101
————
01010
1101
————
111————余数
CRC码的生成步骤
1、将x的最高幂次为R的生成多项式G(x)转换成对应的R+1位二进制数。
2、将信息码左移R位，相当与对应的信息多项式C(x)*2R
3、用生成多项式（二进制数）对信息码做模2除，得到R位的余数。
4、将余数拼到信息码左移后空出的位置，得到完整的CRC码。
【例】假设使用的生成多项式是G(x)=x3+x+1。4位的原始报文为1010，求编码后的报文。
解：
1、将生成多项式G(x)=x3+x+1转换成对应的二进制除数1011。
2、此题生成多项式有4位（R+1），要把原始报文C(x)左移3（R）位变成1010000
3、用生成多项式对应的二进制数对左移4位后的原始报文进行模2除：
1001-------商
------------------------
1010000
1011----------除数
------------
1000
1011
------------
011-------余数（校验位）
5、编码后的报文（CRC码）：
1010000
+    011
------------------
1010011
CRC的和纠错
在接收端收到了CRC码后用生成多项式为G(x)去做模2除，若得到余数为0,则码字无误。若如果有一位出错，则余数不为0，而且不同位出错，其余数也不同。可以证明，余数与出错位的对应关系只与码制及生成多项式有关，而与待测碼字（信息位）无关。图10给出了G(x)＝1011，C(x)＝1010的出错模式，改变C(x)（码字），只会改变表中码字内容，不改变余数与出错位的对应关系。
　收到的CRC码字余数出错位
码位 A7 A6 A5 A4 A3 A2 A1

正确 1 0 1 0 0 1 1
000 无
错误 1 0 1 0 0 1 0
1 0 1 0 0 0 1
1 0 1 0 1 1 1
1 0 1 1 0 1 1
1 0 0 0 0 1 1
1 1 1 0 0 1 1
0 0 1 0 0 1 1
001010100011110111101 1234567
图10 （7，4）CRC码的出错模式（G(x)＝1011）
如果循环码有一位出错，用G(x)作模2除将得到一个不为0的余数。如果对余数补0继续除下去，我们将发现一个有趣的结果；各次余数将按图10顺序循环。例如第一位出错，余数将为001，补0后再除，第二次余数为010，以后依次为100，0ll…，反复循环，这就是“循环码”名称的由来。这是一个有价值的特点。如果我们在求出余数不为0后，一边对余数补0继续做模2除，同时让被检测的校验码字循环左移。图10说明，当出现余数(101)时，出错位也移到A7位置。可通过异或门将它纠正后在下一次移位时送回A1。这样我们就不必像海明校验那样用译码电路对每一位提供纠正条件。当位数增多时，循环码校验能有效地降低硬件代价，这是它得以广泛应用的主要原因。
通信与网络中常用的CRC
在数据通信与网络中，通常k相当大，由一千甚至数千数据位构成一帧，而后采用CRC码产生r位的校验位。它只能检测出错误，而不能纠正错误。一般取r=16，标准的16位生成多项式有CRC-16＝x16+x15+x2+1 和 CRC-CCITT＝x16+x15+x2+1。
一般情况下，r位生成多项式产生的CRC码可检测出所有的双错、奇数位错和突发长度小于等于r的突发错以及（1-2-(r-1)）的突发长度为r+1的突发错和（1-2-r）的突发长度大于r+1的突发错。例如，对上述r=16的情况，就能检测出所有突发长度小于等于16的突发错以及99．997%的突发长度为17的突发错和99．998%的突发长度大于17的突发错。所以CRC码的检错能力还是很强的。这里，突发错误是指几乎是连续发生的一串错，突发长度就是指从出错的第一位到出错的最后一位的长度(但是，中间并不一定每一位都错)。
【例1】某循环冗余码（CRC）的生成多项式 G(x)＝x3+x2+1，用此生成多项式产生的冗余位，加在信息位后形成 CRC 码。若发送信息位 1111 和 1100 则它的 CRC 码分别为＿A＿和＿B＿。由于某种原因，使接收端收到了按某种规律可判断为出错的 CRC 码，例如码字＿C＿、＿D＿、和＿E＿。（1998年试题11）
供选择的答案
A：① lllll00 ② 1111101 ③ 1111110 ④ 1111111
B：① 1100100 ② 1100101 ③ 1100110 ④ 1100111
C～E：① 0000000 ② 0001100 ③ 0010111
   ⑤ 1000110 ⑥ 1001111 ⑦ 1010001 ⑧ 1011000
解：
A：G(x)＝1101，C(x)＝1111 C(x)*23÷G(x)＝1111000÷1101＝1011余111
得到的CRC码为1111111
B：G(x)＝1101，C(x)＝1100 C(x)*23÷G(x)＝1100000÷1101＝1001余101
得到的CRC码为1100101
C～E：
分别用G(x)＝1101对①～⑧ 作模2除: ① 0000000÷1101 余000  ② 1111101÷1101 余001
③ 0010111÷1101 余000  ④ 0011010÷1101 余000  ⑤ 1000110÷1101 余000
⑥ 1001111÷1101 余100  ⑦ 1010001÷1101 余000  ⑧ 1011000÷1101 余100
所以＿C＿、＿D＿和＿E＿的答案是②、⑥、⑧
【例2】计算机中常用的一种检错码是CRC，即 _A_ 码。在进行编码过程中要使用 _B_ 运算。假设使用的生成多项式是 G(X)=X4+X3+X+1，原始报文为11001010101，则编码后的报文为 _C_ 。CRC码 _D_ 的说法是正确的。
在无线电通信中常采用它规定码字长为7位．并且其中总有且仅有3个“1”。这种码的编码效率为_E_。
供选择的答案：
A：① 水平垂直奇偶校验                   ② 循环求和                      ③ 循环冗余                      ④正比率
B：① 模2除法                   ②定点二进制除法                ③二－十进制除法                ④循环移位法
C：① 1100101010111          ② 110010101010011    ③ 110010101011100    ④ 110010101010101
D：① 可纠正一位差错                                              ②可检测所有偶数位错
③ 可检测所有小于校验位长度的突发错                ④可检测所有小于、等于校验位长度的突发错
E：① 3/7    ② 4/7    ③ log23/log27    ④ (log235)/7
解：从前面有关CRC的论述中可得出：  A：③ 循环冗余  B：① 模2除法
C：G(x)＝11011，C(x)＝11001010101，C(x)*24÷G(x)＝110010101010000÷11011 余0011
得到的CRC码为② 110010101010011
D：从前面有关通信与网络中常用的CRC的论述中可得出：④ 可检测所有小于、等于校验位长度的突发错
E：定比码又叫定重码，是奇偶校验的推广。在定比码中，奇数或偶数的性质保持不变，然而附加一种限制，每个字中1的总数是固定的。随用途之不同，定比码要求的附加校验位可能多于一个，但较之单一的奇偶校验将增加更多的检错能力。
所谓7中取3定比码，就是整个码字长度为7位，其中1的位数固定为3。所有128个7位代码（0000000～1111111）中只有1的位数固定为3的才是其合法码字。可以用求组合的公式求出其合法码字数为：C73＝7!/(3!*(7-3)!)＝7*6*5/(1*2*3)＝35
编码效率＝合法码字所需位数/码字总位数＝(log235)/7