数字图像处理:第二十二章 基于模型的编码

来源:互联网 发布:软件问题跟踪表 编辑:程序博客网 时间:2024/05/01 19:43

第二十二章基于模型的编码

目录

  1. 引言
  2. 基于对象的编码
  3. 基于模型的编码

作业

 


1. 引言

为了获得更高的压缩效率并保持一定的视频质量以支持超低码率(大约10kbps)双向视频应用,不考虑内容特点的仅仅针对帧内和帧间冗余的通用压缩算法难以胜任。此外为了拓展数字视频的应用,具有内容检索功能的交互式视频越来越重要,这需要在编码的过程中加以考虑。目前正在制定的MPEG-4和MPEG-7压缩标准就是迎合这种需要产生的,它的核心是一种新的基于结构化模型的压缩方法即基于模型的分析-综合编码技术[1]。

2. 基于对象的编码

基于对象的编码是将图象中的物体分割出来作为视频对象,以视频对象为单位进行编码。例如,目前MPEG-4中的视频对象包括:自然视频对象、Sprite对象、2D网格对象、3D人脸和身体对象、静态的纹理对象、3D网格对象和音频对象[2]。

基于对象编码的原理图如下图所示。

例如,自然视频对象分割:

 

3. 基于模型的编码

基于模型的编码可以看作是一种特殊的基于对象的编码,此时对象的结构更复杂,除了在对象的边界存在形状特征外,在对象的纹理区域也存在一定的结构,这些结构信息通过网格模型的内部节点和边来表示[2]。

基于模型的编码的原理图如下所示:

3.1 2D网格模型

在MPEG-4中定义了两类2D网格模型:

  1. 是一个规则的网格模型 (b)是基于内容的网格模型

 

3.2 Sprite编码技术

Sprite编码技术是针对背景对象的特点提出的。通常情况下背景对象自身没有任何运动,由于摄象机的运动而造成图象序列中的背景变化,通过图象的镶嵌技术把整个序列的背景图象拼接成一个大的完全的背景图象,这个图象就叫Sprite图象[2]。

Sprite编码技术是指首先对Sprite图象编码并传输一次并存储在解码端,在随后的图象只需要传输摄象机的运动参数,就可以从Sprite上恢复所有的背景。

Sprite编码分为静态Sprite编码和动态Sprite编码,静态Sprite图象在编码前生成,动态Sprite图象在编码过程中生成。

Sprite编码效率高,主要面向视频会议和视频电话等场景固定的应用中,这时可以将背景的全景图事先传输过去并保存在解码端。

Sprite编码技术的原理如下图所示:

 

参考文献

  1. A.M. Tekalp (崔之祜、江春、陈丽鑫), Digital video processing, Prentice Hall电子工业出版社,1998
  2. 贺玉文,MPEG-4, MPEG-7简介

 

致谢

我要感谢清华大学计算机系的博士研究生贺玉文同学,本章内容是根据他的学术报告编辑的,内容和图片取自:贺玉文,MPEG-4, MPEG-7简介

作业

 


返回主目录返回本章目录

清华大学计算机系 艾海舟

最近修改时间:2000年4月15日


出处:http://media.cs.tsinghua.edu.cn/~ahz/digitalimageprocess/CourseImageProcess.html

0 0
原创粉丝点击