基于HVS 的结构相似性的视频质量评价

来源：互联网发布：淘宝的运营模式是编辑：程序博客网时间：2024/05/22 02:24

　　清华大学的汪志兵，廖煜鹏，汪博，秦明海，林行刚等人在《通信技术》2010年第2期上发表。
　　HVS 对不同频率分量的敏感性不同，对视频帧不同部分的关注度也不相同。为了达到更好的效果，论文中引入3 个因子对宏块的权重加以调节，分别是亮度因子、纹理因子和空间位置因子，同时利用运动估计矢量来计算序列中单个帧的权重。
　　视频的纹理特征可由其频率分量表示，利用离散余弦变换（DCT）从视频帧中提取和分析频率分量：
　　　　　　　　　这里写图片描述
　　其中 f (x, y)是原始序列帧中的块，F(u,v) 是变换后的系数，假设宏块尺寸为 N × N 。
　　变换后的直流和交流系数定义为：
　　　　　　　　　
　　频域结构比较函数可定义为：
　　　　　　　　　　　　　　这里写图片描述
　　其中σFx、σFy是频域中x、y的加权标准差， σFxy是频域中x、y 的加权协方差。这些参数用以下方程得出:
　　　　　　　　　　　　　　　　
　　　　　　　　　　　　　　
　　中Ｗuv是视觉敏感性权值，其代表频域的注意力敏感性。为了更好的匹配HVS的特征，引入三个附加的因子：亮度因子，纹理因子和空间因子。
　　人眼感受到的刺激强度不仅与刺激的物理强度相关，也和背景的强度相关，后者即是整个图像的平均亮度。根据韦伯－费克内（Weber-Fechner）定律，可以得出：
　　　　　　　　　　　　　　　　　　　　　　这里写图片描述
　　其中，s 是感受到的亮度，k 为常数，Ｉ和分别是像素的亮度和背景的亮度。
　　为每一宏块分配一个亮度权值。假定k =1，定义、分别为第k 个块的亮度最大值和平均值：
　　　　　　　　　　　　　　　　　这里写图片描述
　　　　　　　　　　　　
　　对HVS 的研究表明，人眼对富含结构信息的区域更为敏感，同等强度的噪声产生的失真在纹理丰富的区域更容易被察觉。因此，给纹理更多的区域分配更大的权值。
　　　　　　　　　　　　这里写图片描述
　　人眼只能在有限的区域内具备精细的分辨能力，并忽略外围区域的大量细节
信息，场景中不同部分的重要性通常是从中心到边缘递减的。考虑空间位置因子，为每个宏块指定空间位置权值，一个中心位于(x, y) 的宏块的空间位置权值为：
　　　　　　　　　　　　　　这里写图片描述
　　其中，Ｘｃ、Ｙｃ是中心块的中心位置，Ｄmax 是各像素到中心的最大距离，C 是取值0～1 的参数，决定空间位置加权的程度。
　　宏块总权值Ｗij定义为：
　　　　　　　　　　　　　　　　
　　人们认为快速运动的物体的细节更难辨别，因此快速运动帧中的失真的严重性比静止帧的要低。如果一帧中的快速运动较多，该帧运动矢量的总长度将较大，因而该帧的重要性就越低，计算各帧的权值：
　　　　　　　　　　　　　这里写图片描述
　　ω 是ｉ帧的亮度权值， M 是ｉ帧中运动矢量的长度之和。
　　
　　实验结果：
　　　　　　　　　　　　

0 0