H.264/MPEG-4 Part 10 White Paper 翻译（1）--概述

来源：互联网发布：c语言大于等于符号编辑：程序博客网时间：2024/05/23 12:19

H.264综述

1. 引言

数字电视和DVD-video的出现使得广播电视和家庭娱乐发生了彻底的变革.随着视频压缩技术的标准化,越来越多的这些应用成为可能.MPGE系列的下一个标准,MPEG4,正使得新一代的基于因特网的视频应用成为可能.而现在视频压缩的ITU-T H.263标准被广泛的应用于视频会议系统．

MPEG4(视频)和H.263都是基于视频压缩(视频编码)技术的标准(大约从1995年开始).运动图像专家组和视频编码专家组(MPEG和VCEG)致力于开发一个比MPEG4和H.263有更好性能的新标准,有着高品质,低比特视频流的特性一个更好的视频图像压缩方法.新标准"高级视频编码"(AVC)的历史可追溯到7年前.

1995年,为了通过电话线传输视频信号而制定的H.263标准定稿以后.ITU-T视频编码专家组(VCEG)就开始工作在两个更深入的发展领域:一个是"短期"的努力去增加H.263的额外特性(制定出标准的版本2),还有一个"长期"的努力,去开发一个适用于低比低率下可视通信的新标准,提供比之前的ITU-T标准更有效,明显更好的视频压缩方法.2001年,ISO运动图像专家组(MPEG)意识到H.26L的潜在优点,就组成了视频联合工作组(JVT),包括MPEG和VCEG的的专家.JVT的主要任务就是将H.26L"模式"草案发展成为一个完全的国际标准.实际上,结果产生了两个标准:ISO MPEG4第10部分和ITU-T H.264. 新标准的官方命名是"高级视频编码"(AVC);然而,旧的命名H.26L和以ITU文档号命名的IH.264[1]更广为人知.

2. H.264 编解码器

和之前的标准一样(如MPEG1,MPEG2和MPEG4),H.264标准草案并没有明确定义一个编解码器.在一定程度上,标准定义了视频比特流编码和与之相对应的解码方法的语法.然而实际上,一个符合的编码和解码器一般包括如图Figure 2-1 和Figure 2-2中所示的功能模块.同时这些图中所示功能通常是必须的,但编解码器还是可以有相当多的变种.基本的功能模块(预测,传输,量化,熵编码)与之前的标准(MPEG1,MPEG2,MPEG4,H.261,H.263)差不多.H.264的最重要的变化是在这些功能模块的实现细节上.

编码器包括两个数据流路径.一个"前向"路径(从左到右,以蓝色表示)和一个"重构"路径(从右到左,以洋红色表示，翻译中以黑色).解码器的数据流路径以从右到左的方式表示,以此来说明编码器和解码器之间的相同点.

2.1 编码器（前向路径）

当一个输入帧Fn提交编码时，该帧以宏块（对应于原图中的16x16的像素点）为单位进行处理。每个宏块被编码成帧内模式或帧间模式。在这两种情况下，会产生一个基于重建帧的预测宏块P。在帧内模式下，P由当前帧n中已经编码、解码和重建好的样本中产生（图中的uFn'；注意，没有滤波的样本被用来构成P）。在帧间模式下，P由运动补偿预测来产生，该运动补偿预测可基于一个或多个参考帧。在图中，参考帧表示为之前已经编码的帧F’n-1；然而，每个宏块的预测可能根据过去或将来（以时间为序）的一或多个已经编码并重构的帧来产生。

预测P被从当前宏块中减去，得到一个残差或者差异宏块Dn。它经过变换（块变换）量化后得到一个量化后的变换系数集，被赋予X。这些系数被重排和熵编码。熵编码后的系数，和用于解码宏块的支持信息（如宏块预测模式、量化步长、描述宏块如何进行运动补偿的运动向量等）构成了压缩比特流。该流被传输给一个网络抽象层（Network Abstraction Layer， NAL）用来传输或者存储。

2.2 编码器（重建路径）

量化后的宏块系数X解码后用于重建一个帧，该镇用于后续的宏块的编码。系数X经过反量化（Q^-1）和逆变换（T^-1）来产生一个差异宏块Dn'。该差异宏块与原始的差异宏块Dn并不是相等的；在量化过程引入了误差，所以Dn’是Dn的一个失真版本。

预测宏块P加到残差Dn'上生成了一个重建宏块uFn'（原始宏块的一个失真版本）。此处应用了一个去方块滤波器来减少块失真效应，得到Fn'，而参考帧由一系列的宏块Fn’创建。

2.3 解码器

解码器从NAL中接收到一个压缩后的比特流，数据元素经过熵解码和重排生成了一个量化后的系数集X。这些系数经过反量化和反变换后赋予Dn’（Dn'与编码器中的Dn’是相等的）。使用比特流中的头信息，解码器创建了一个预测宏块P，它与编码器中的原始预测宏块P是相同的。P被加到Dn'上产生uFn'，uFn'经过滤波后生成解码宏块Fn'。

从图中和上述讨论中应该能够清楚：编码器中的重建路径是为了保证编码器和解码器使用相同的参考帧来创建预测P（How？）。如果不这样的话，编码器中的预测P和解码器中的P将会不同，导致编码器和解码器之间存在一个越来越大的误差或是“偏移”（why & how）。

3．参考资料

1 ITU-T Rec. H.264 / ISO/IEC 11496-10, “AdvancedVideo Coding”, Final Committee Draft, Document JVTE022,September 2002

注：本文翻译前面部分复制自huybin_wang的博客，中间部分的翻译为个人完成（附原文地址H.264/MPEG-4 Part 10 White Paper 译(一) Overview）

0 0