基于HVS 的结构相似性的视频质量评价

来源:互联网 发布:淘宝的运营模式是 编辑:程序博客网 时间:2024/05/22 02:24

  清华大学的汪志兵, 廖煜鹏, 汪 博, 秦明海, 林行刚等人在《通信技术》2010年第2期上发表。
  HVS 对不同频率分量的敏感性不同,对视频帧不同部分的关注度也不相同。 为了达到更好的效果,论文中引入3 个因子对宏块的权重加以调节,分别是亮度因子、纹理因子和空间位置因子,同时利用运动估计矢量来计算序列中单个帧的权重。
  视频的纹理特征可由其频率分量表示,利用离散余弦变换(DCT)从视频帧中提取和分析频率分量:
         这里写图片描述
  其中 f (x, y)是原始序列帧中的块,F(u,v) 是变换后的系数,假设宏块尺寸为 N × N 。
  变换后的直流和交流系数定义为:
         这里写图片描述
  频域结构比较函数可定义为:
              这里写图片描述
  其中σFx、σFy是频域中x、y的加权标准差, σFxy是频域中x、y 的加权协方差。这些参数用以下方程得出:
                这里写图片描述
              这里写图片描述
  中Wuv是视觉敏感性权值,其代表频域的注意力敏感性。为了更好的匹配HVS的特征,引入三个附加的因子:亮度因子,纹理因子和空间因子。
  人眼感受到的刺激强度不仅与刺激的物理强度相关,也和背景的强度相关,后者即是整个图像的平均亮度。根据韦伯- 费克内(Weber-Fechner)定律,可以得出:
                      这里写图片描述
  其中,s 是感受到的亮度,k 为常数, I 和这里写图片描述分别是像素的亮度和背景的亮度。
  为每一宏块分配一个亮度权值。假定k =1,定义这里写图片描述这里写图片描述分别为第k 个块的亮度最大值和平均值:
                 这里写图片描述
            这里写图片描述
  对HVS 的研究表明,人眼对富含结构信息的区域更为敏感,同等强度的噪声产生的失真在纹理丰富的区域更容易被察觉。因此,给纹理更多的区域分配更大的权值。
            这里写图片描述
  人眼只能在有限的区域内具备精细的分辨能力,并忽略外围区域的大量细节
信息,场景中不同部分的重要性通常是从中心到边缘递减的。考虑空间位置因子,为每个宏块指定空间位置权值,一个中心位于(x, y) 的宏块的空间位置权值为:
              这里写图片描述
  其中,Xc、Yc是中心块的中心位置,Dmax 是各像素到中心的最大距离,C 是取值0~1 的参数,决定空间位置加权的程度。
  宏块总权值Wij定义为:
                这里写图片描述
  人们认为快速运动的物体的细节更难辨别,因此快速运动帧中的失真的严重性比静止帧的要低。如果一帧中的快速运动较多,该帧运动矢量的总长度将较大,因而该帧的重要性就越低,计算各帧的权值:
             这里写图片描述
  ω 是i帧的亮度权值, M 是i帧中运动矢量的长度之和。
  
  实验结果:
            这里写图片描述

0 0
原创粉丝点击