H.264帧内编码的模式选择
来源:互联网 发布:室内设计书籍 知乎 编辑:程序博客网 时间:2024/05/18 01:20
H.264帧内编码的模式选择
H.264中4X4亮度预测依据预测方向的不同共有9种预测模式。在亮度4x4帧内预测时,其中DC预测(模式2)、垂直预测(模式0)和水平预测(模式2总是被认为有效的,即使在编码块上面像素或左边像素不可用的情况下(这时候上面像素或左边像素的值就使用128这个值来代替),而其它模式仅当所有需要利用的预测象素点都可用的情况下才可以使用(如果E, F, G,H不可用,可以用D的值来代替)。这儿所说的像素点可用(available)是指此像素所在的子块存在并且与当前编码的子块属于同一个slice。
模式选择
在H.264帧内编码中,每个宏块亮度信号都要完成9种4x4预测模式和4种16x16预测模式,然后通过预测模式选择,得出一种最佳预测模式使得编码后的图像在码流和图像质量两者权衡后的获得一个最佳。H.264中模式选择方法有两种:
1、使用率失真优化(RDO)模式选择。
使用这种RDO方式的模式选择过程如下:
1)在给定最后解码的帧及宏块的量化因子QP后,计算拉格朗日因子:
X=0.85*QP2 (1)
2)在帧内亮度4x4预测的9种预测模式中,通过计算下面的函数使得其值最小,从中选择最佳的帧内亮度4x4预测模式。
J(s, c, m I QP, Xm )=SSD(s, c, m I QP)+X*R(s, c, m I QP) (2)
式中QP是宏块的量化参数,X是(1)中的拉格朗日因子,SSD是原始的亮度块s与预测模式为m的重建块的平方差的和,R表示与选择模式m相关联的比特数,包括模式编帧内模式及DCT系数所需的比特数。
3)在帧内16x16预测模式中,通过计算4种16x16宏块的SATD(绝对变换差和)使得其值最小来确定最佳16x16亮度帧内预测模式。
4)通过比较一个宏块使用4x4预测模式时计算的RD代价值与使用16x16帧内预测模式时计算得到的最小代价值,选取代价最小的作为最佳预测模式。
2、基于SAD(或SATD)和速率估计的模式选择方法。对于这种模式选择方法,其亮度4x4预测模式的代价函数的计算方法如下所示:
Cost=SAD+4R*λ(QP) (3)
式中λ(QP)是QP的指数函数,4R是对使用某种预测模式后比特数的估计,R根据当前模式是否为最有可能的模式取值为0或1。式中SAD (绝对差值和)计算的差值是预测值与图像像素值的差值,为了更准确的比较每种模式的Cost值,H.264还对这些差值进行Hadamard变换,将差值(这些值最后要变换到频域进行编码)变换到频域求绝对差值和,这样计算得到的值叫作绝对变换差和(SATD)。这里使用Hadamard变换而不是使用DCT变换主要考虑到Hadamard变换比较简单,而又比较接近DCT变换。在计算4x4块的每一种模式的Cost值后,将Cost值最小的模式判决为最佳亮度4x4预测模式。对于亮度信号的16x16模式选择,其开销计算函数如下所示:
Cost =SATD (4)
式中的SATD也是绝对变换差和,其计算时也是将预测值与图像像素值的差值通过使用Hadamard变换,变换到频率域后求和最后比较一个宏块做一次16xl6预测后的开销值Cost和做16次4x4预测后Cost值相加得到的总的开销值Cost的大小,选取Cost最小的作为最后宏块的预测模式。如果Cost值相同4x4预测模式将被优先选取,而如果9种4x4预测模式或4种4x4预测模式中出现相同Cost值时,序号较小的预测模式将被选为最佳预测模式。比较两种模式选择方法可以看出,在RDO模式中,R值被精确地计算出,从而使得其模式选择的准确度大大提高,但为了计算R值需要非常复杂的计算,从而使得其运算复杂度很高,而基于SAD的模式选择由于R值是一个估计值避免了复杂的计算,所以速度大大提高,但选择的准确度也会下降。使用RDO模式选择的方法与使用基于SAD的模式选择方法相比,基于SAD的模式选择计算复杂度平均为RDO模式选择的7%,但与使用RDO模式选择相比基于SAD的模式选择方法PSNR平均降低。
一个宏块组合模式选择过程:
a) 对于4x4帧内预测模式建立相应的帧内预测块
b) 计算预测4x4块和原始块4x4块之间的SAD,以及相应的编码比特率
c) 计算该模式的率失真开销Rdcost
d) 重复以上a~c步,遍历所有的9种4x4帧内预测模式
e) 选取具有最小率失真开销的模式作为最佳预测模式
f) 对宏块中16个4x4块重复以上a~e,获得每一个4x4块的最佳模式和相应的Rdcost,进而获得该宏块的总Rdcost
g) 按类似的方法遍历4种16x16宏块的帧内预测模式并计算相应的宏块Rdcost,选取最小的模式为最佳16x16模式
h) 根据f和g中最小的宏块Rdcost,判断亮度宏块采用4x4或16x16帧内预测模式
i) 对每一种8x8色度宏块的帧内预测模式(两个色度宏块使用相同的模式)计算相应的Rdcost,并重复以上a~h,获得相应的宏块组合Rdcost作为该宏块组合的最佳帧内预测模式
补充一下
跟踪了一下JM86代码,发现如下:
帧内4*4亮度预测时,采用的是RDO模型,即上述第一种模型,分别求得每个4*4块的最佳预测模式,然后求得16个4*4最佳预测模式的总的cost。
帧内16*16亮度预测时,采用的也是RDO模型,计算SATD(通过Hadamard变换来求),然后求得最佳预测模式,以及该最佳预测模式的cost。
分别求出4*4 和 16*16的最佳预测模式后,再与色度预测模式一起做RDO,最后得出该macroblock的最佳预测模式。
- H.264帧内编码的模式选择
- H.264帧内编码的模式选择
- H.264帧内编码的模式选择
- h.264视频编码中快速的帧内预测模式选择
- 帧内编码的模式选择
- H.264帧内模式选择以及代价计算相关知识
- H.264帧内模式选择以及代价计算相关知识
- H.264帧内模式选择以及代价计算相关知识
- H.264预测编码之帧内预测
- 【H.264/AVC视频编解码技术详解】十六:帧内预测编码的基本原理
- H.264模式选择问题
- H.264率失真优化的模式选择问题
- 【H.264/AVC视频编解码技术详解】十七:帧内预测编码的预测实现方法
- H.265 帧内PCM模式详解
- 【H.264/AVC视频编解码技术详解】十二、解析H.264码流的宏块结构(下):H.264帧内编码宏块的预测结构
- H.264编码的介绍
- H.264编码的介绍
- X264帧内预测编码模式
- SharePoint 2013 显示用户Lync是否在线(集成Lync)
- 对比iOS网络类库:AFNetworking VS ASIHTTPRequest
- 你应该更新的Java知识之常用程序库(一)
- 低预算选购中高配车 海马M3 1.5L一个不错的选择
- MySQL 触发器简单实例
- H.264帧内编码的模式选择
- VBD T38 T30传真的区别
- MySQL数据库相关
- linux命令 .
- HDU-1285简单的拓扑排序
- Android 颜色渲染(九) PorterDuff及Xfermode详解
- 深入挖掘IDR_MAINFRAME
- javacript里的内存模型
- 你应该更新的Java知识之常用程序库(二)