修改版：基于上下文的自适应变长编码CAVLC原理与流程

来源：互联网发布：mac边充电边用好吗编辑：程序博客网时间：2024/05/17 03:51

原文链接：点击打开链接

阅读原文的过程中发现一些不太对的地方，现把我的修改版发布到这里。

CAVLC概念

CAVLC的全称是Context-Adaptive Varialbe-Length Coding，即基于上下文的自适应变长编码。CAVLC的本质是变长编码，它的特性主要体现在自适应能力上，CAVLC可以根据已编码句法元素的情况动态的选择编码中使用的码表，并且随时更新拖尾系数后缀的长度，从而获得极高的压缩比。H.264标准中使用CAVLC对4×4模块的亮度和色度残差数据进行编码。

CAVLC原理

在H.264标准编码体系中，视频图像在经过了预测、变换及量化编码后表现出如下的特性：4×4块残差数据块比较稀疏，其中非零系数主要集中在低频部分，而高频系数大部分是零；量化后的数据经过zig-zag扫描，DC系数附近的非零系数值较大，而高频位置上的非零系数值大部分是+1和-1；相邻的4×4块的非零系数的数目是相关的。CAVLC就是利用编码后残差数据的这些特性，通过自适应对不同码表的选择，利用较少的编码数据对残差数据进行无损的熵编码，进一步减少了编码数据的冗余和相关性，提高了H.264的压缩效率。

CAVLC编码流程

视频图像在经过预测、变换和量化编码后，需要经过Zig-zag扫描和重新的排序过程，为后序的CAVLC编码进行准备。一个残差数据块的CAVLC熵编码的流程如图所示：

CAVLC熵编码处理流程

1、TotalCoeffs和TrailingOnes的编码

从码流的起始位置开始计算整个编码块中非零系数的数目（TotalCoeffs），非零系数的数目为从0~16，非零系数的数目被赋值给变量TotalCoeffs。

拖尾系数是指码流中正或者负1的个数（+/-1）。拖尾系数的数目（TrailingOnes）被限定在3个以内，如果+/-1的数目超过3个，则只有最后3个被视为拖尾系数，其余的被视为普通的非零系数，拖尾系数的数目被赋值为变量TrailingOnes。

2、判断计算NC值

NC（Number Current 当前块值）值的计算集中体现了CAVLC的基于上下文的思想，通过NC值选择不同H.264标准附录CAVLC码表。

3、查表获得coeff_token编码

根据之前编码和计算过程所得的变量TotalCoeffs、TrailingOnes和nC值可以查H.264标准附录CAVLC码表，即可得出coeff_token编码序列。

4、编码每个拖尾系数的符号：

前面的coeff_token编码中已经包含了拖尾系数的总数，还需进一步对拖尾系数的符号进行编码。由于拖尾系数符合为正（+）或负（-），因此，在H.264标准中规定用0表示（+1）、1表示（-1）。当拖尾系数的数目超过3个只有最后3个被认定为拖尾系数，因此对符号的编码顺序应按照反向扫描的顺序进行。

5、编码除拖尾系数之外的非零系数的幅值（Levels）

非零系数的幅值（Levels）由两个部分组成：前缀（level_prefix）和后缀（level_suffix）。levelCode、levelSuffixsSize和suffixLength是编码过程中需要使用的三个变量，其中levelCode是中间过程中用到的无符号数，levelSuffixsSize表示后缀长度位数，suffixLength代表Level的码表序号。

通常情况下变量levelSuffixsSize的值等于变量suffixLength的值，但有两种情况例外：

(1)当前缀等于14时，suffixLength等于0，levelSuffixsSize等于4。

(2)当前缀等于15时，levelSuffixsSize等于12。

变量suffixLength是基于上下文模式自适应更新的，suffixLength的更新与当前的suffixLength的值以及解码好的非零系数的值（Level）有关。suffixLength数值的初始化以及更新过程如下:

(1)普通情况下suffixLength初始化为0，但是当块中有多于10个非零系数并且其中拖尾系数的数目少于3个，suffixLength初始化为1。

(2)对在最高频率位置上的非零系数编码。

(3)如果当前已经编码号的非零系数值大于预先定义好的阈值，变量suffixLength加1。

6、编码最后一个非零系数前零的数目(TotalZeros)

TotalZeros(total_zeros)指的是在最后一个非零系数前零的数目，此非零系数指的是按照正向扫描的最后一个非零系数。因为非零系数数目（TotalCoeffs）是已知，这就决定了TotalZeros可能的最大值。根据TotalCoeffs值，H.264标准共提供了25个变长表格供查找，其中编码亮度数据时有15个表格供查找，编码色度DC 2×2块（4:2:0格式）有3个表格、编码色度DC 2×4块（4:2:2格式）有7个表格。

7、编码每个非零系数前零的个数（RunBefore）

在CAVLC中，变量 ZerosLeft表示当前非零系数左边的所有零的个数，ZerosLeft的初始值等于TotalZeros。每个非零系数前零的个数RunBefore(run_before)是按照反序来进行编码的，从最高频的非零系数开始。H.264标准中根据不同ZerosLeft和RunBefore，构建了RunBefore编码表格供编码查找使用。根据表格每编码完一个RunBefore，对ZerosLeft的值进行更新，继续编码下一个RunBefore，直至全部完成所有非零系数前零的个数的编码。当ZerosLeft=0即没有剩余0需要编码时或者只有一个非零系数时，均不需要再进行RunBefore编码。

CAVLC解码流程

CAVLC熵解码是上述CAVLC熵编码的逆过程，CAVLC熵解码的输入数据是来自片层数据的比特流，解码的基本单位是一个4×4的像素块，输出为包含4×4块每个像素点所有幅值的序列。CAVLC解码步骤如下：

1. 初始化所有的系数幅值

2. 解码非零系数个数（TotalCoeff）和拖尾系数个数（TrailingOnes）。

3. 解码拖尾系数符号（trailing_ones_sign_flag）

4. 解码非零系数幅值

5. 解码total_zeros和run_before

6. 组合非零系数幅值和游程信息，得到整个残差数据块

下面用一个实例来阐述CAVLC编解码的流程

编码过程：

假设有一个 4*4 数据块（变化，量化后就送入熵编码）

{

0 , 3 , -1 , 0,

0, -1, 1, 0,

1 , 0 , 0 ,0,

0 , 0 , 0 ,0

}

数据重排列： 0 ， 3 ， 0 ， 1 ， -1 ， -1 ， 0 ， 1 ， 0……

1 ）初始值设定：

非零系数的数目（ TotalCoeffs ） =5 ；

拖尾系数的数目（ TrailingOnes ） =3 ；

最后一个非零系数前零的数目（ TotalZeros ） =3 ；

变量 NC=1;

（说明： NC 值的确定：色度的直流系数 NC=-1 ；其他系数类型 NC 值是根据当前块左边 4*4 块的非零系数数目（ NA ）当前块上面 4*4 块的非零系数数目（ NB ）求得的，见毕厚杰书 P120 表6.10 ）

SuffixLength =0 ；

i =TotalCoeffs = 5;( 反序编码 )

2 ）编码 coeff_token ：

查标准（ BSISO/IEC 14496-10:2003 ） Table9-5 ，可得：

If(TotalCoeffs == 5 &&TrailingOnes == 3 && 0<= NC < 2)

coeff_token =0000 100;

Code output =0000100;

3 ）编码所有 TrailingOnes 的符号：

逆序编码，三个拖尾系数的符号依次是＋（ 0 ），－（ 1 ），－（ 1 ）；即 :

TrailingOne sign[i--] = 0;

TrailingOne sign[i--] = 1;

Code output =0000100 011;

4 ）编码除了拖尾系数以外非零系数幅值 Levels ：（毕厚杰的书上针对这个例子说的不是很细，而且有个小错误）

过程如下：

（ 1 ）将有符号的 Level[i] 转换成无符号的 levelCode ；

如果 Level[ i] 是正的， levelCode = (Level[ i]<<1) –2;

如果 Level[ i] 是负的， levelCode = - (Level[ i]<<1) – 1;

（ 2 ）计算 level_prefix ： level_prefix= levelCode /(1<<SuffixLength)；查表 9-6 可得所对应的 bitstring ；

（ 3 ）计算 level_suffix ： level_suffix= levelCode %(1<<SuffixLength)；

（ 4 ）根据 SuffixLength的值来确定后缀的长度；

（ 5 ） SuffixLength updata ：

If (SuffixLength== 0 )

SuffixLength++ ；

else if (levelCode >(3<<SuffixLength-1)&& SuffixLength<6)

注：大于预置值就 SuffixLength++;

SuffixLength++;

回到例子中，依然按照逆序，Level[i--] = 1；（此时i = 1）levelCode = 0；level_prefix = 0；

查表9-6，可得level_prefix =0时对应的bit string = 1；

因为SuffixLength初始化为0，故该Level没有后缀；

因为SuffixLength = 0，故SuffixLength++；

Code output =0000 100011 1；

编码下一个Level：Level[0] = 3；levelCode = 4；level_prefix = 2；

查表得 bit string = 001；

level_suffix =0；SuffixLength = 1；故码流为0010；

Code output =0000 100011 1 0010 ；

i = 0，编码Level结束。

5）编码最后一个非零系数前零的数目（TotalZeros）：

查表9-7，当TotalCoeffs =5，TotalZeros = 3时，bit string = 111；

Code output =0000 100011 1 0010 111；

6）对每个非零系数前零的个数（RunBefore）进行编码：

i =TotalCoeffs = 5；ZerosLeft =TotalZeros = 3；查表9-10：

依然按照逆序编码

ZerosLeft =3,run_before = 1， run_before[4]=10;

ZerosLeft =2,run_before = 0 ，run_before[3]=1;

ZerosLeft =2,run_before = 0， run_before[2]=1;

ZerosLeft =2,run_before = 1， run_before[1]=01;

ZerosLeft =1,run_before = 1，run_before[0] 最后一个非零系数不需要码流来表示

Codeoutput =0000 100 011 1 0010 111 10 1 1 01；

编码完毕。（CAVLC主要是查表，标准中的表是通过大量实验的出来的！）

解码过程：

接收码流为：0000 1000 1110 0101 11101101

计算NC = 1

1.根据coeff_token和NC查表(见标准表9-5)，得到非零系数数目TotalCoeffs和拖尾系数数目TrailingOnes

NC = 1选择对应的表，coeff_token为0000100，查表得到TotalCoeffs=5,TrailingOnes=3

输出序列：无

2. 解析拖尾系数

由第一步得到拖尾系数有3个，输入拖尾系数符号编码码流011，得到两个拖尾系数由先到后是 -1，-1，1

output：-1，-1，1（反序输出）

3. 解析除拖尾系数外的非零系数的幅值（Levels）

（1）确定后缀长度SuffixLength

（2）根据码流查表9-6得到前缀level_prefix

（3）根据前缀和后缀，得到

LevelCode=(level_prefix<<SuffixLength)+level_suffix

（4）LevelCode为偶数 level=(level+2)/2

LevelCode为奇数 level=(-level-1)/2

（5）根据设定的阈值确定是否updateSuffixlength

回到例子中，按照逆序

i=0, SuffixLength=0,查表9-6，1对应的前缀level_prefix=0，levelCode=0,

计算得到level=1 , i++ ， SuffixLength++（第一次都要加）

i=1,SuffixLength=1,查表0010（3为前缀，1位后缀）对应的前缀 level_prefix=2,计算levelCode=4，level=3,i++

i=2>=TotalCoeffs-TrailingOnes,除拖尾系数外的非零系数解析完毕

output：3，1，-1，-1，1

4.解析每个非零系数前零的个数

根据TotalCoeffs=5和输入码流111查表9-7得到TotalZeros=3

初始i=TotalCoeffs-1=4 ,zerosleft=total_zeros=3, 5个非零系数前零的数目解析如下：

i=4,zerosleft=3,根据码流10，查表9-10,run_before[i]=1,

输出序列：3，1，-1，-1，0，1

i=3,zerosleft=3-1=2,根据码流1，查表run_before[i]=0，

输出序列：3，1，-1，-1，0，1

i=2,zerosleft=2-0=2,根据码流1，查表run_before[i]=0，

输出序列：3，1，-1，-1，0，1

i=1,zerosleft=2-0=2,根据码流01，查表run_before[i]=1，

输出序列：3，0，1，-1，-1，0，1

i=0,zerosleft=2-1=1，

输出序列：0，3，0，1，-1，-1，0，1

5. 解码完毕，将剩下的元素用0补齐，反序排列就可以得到4*4矩阵。

6. 最后还原为一个4*4数据块

{

0 , 3 , -1 , 0,

0, -1, 1, 0,

1, 0 , 0 , 0,

0 , 0 , 0 , 0

}