信源编码第一次作业

来源:互联网 发布:域名购买后有什么用 编辑:程序博客网 时间:2024/04/29 15:42

一、视频(图像)压缩基本知识:

所谓视频(图像)编码方式就是指通过特定的压缩技术,将某个视频格式的文件转换成另一种视频格式文件的方式。视频格式有以下几种AVI格式DV-AVIMPEGDivXMOVASFWMVRMRMVB。视频数据中存在大量的余,主要有:空间冗余、时间冗余、结构冗余、知识冗余、视觉冗余、图像区域的相同性冗余和文理统计冗余。基于这些冗余可以对其进行压缩。JPEG压缩分四个步骤实现:(1)颜色模式转换及采样;(2DCT变换;(3)量化;(4)编码。这里简单介绍一下颜色模式转换及采样。

RGB色彩系统是我们最常用的表示颜色的方式。JPEG采用的是YUV色彩系统。想要用JPEG基本压缩法处理全彩色图像,得先把RGB颜色模式图像数据,转换为YUVr颜色模式的数据。Y代表亮度,UV则代表色度、饱和度。通过下列计算公式可完成数据转换:


人类的眼睛对亮度的改变也比对色彩的改变要敏感得多,也就是说Y成份的数据是比较重要的。既然U成份和V成份的数据比较相对不重要,就可以只取部分数据来处理。以增加压缩的比例。JPEG通常有两种采样方式:YUV411YUV422,它们所代表的意义是YUV三个成份的数据取样比例。用三个图来直观地表示采集的方式吧,以黑点表示采样该像素点的Y分量,以空心圆圈表示采用该像素点的UV分量。


也就是说,对于YUV 4:4:4采样,每一个Y对应一组UV分量。对于YUV 4:2:2采样,每两个Y共用一组UV分量。对于YUV 4:2:0采样,每四个Y共用一组UV分量。

二、音频压缩基本知识

要在计算机内播放或是处理音频文件,也就是要对声音文件进行数、模转换,这个过程同样由采样和量化构成。人耳朵对音频信号的听觉灵敏度有其其规律性,对于不同频段或不同声压级的伴音有其特殊的敏感特性。在伴音数据压缩过程中,主要应用了听觉阈值及掩蔽效应等听觉心理特性。通常使用三个参数来表示声音:采样位数、采样频率和声道数。在进一步了解音频处理和压缩之前需要明确如下几个概念。

音调:泛指声音的频率信息,人耳的主观感受为声音的低沉(低音)或者尖锐(高音)。

响度:声音的强弱。

采样率:声音信息在由模拟信号转化为数字信号过程中的精确程度,采样率越高,声音信息保留的越多。

采样精度:声音信息在由模拟信号转化为数字信号过程中,表示每一个采样点所需要的字节数,一般为16bit(双字节)表示一个采样点。

声道数:相关的几路声音数量,常见的如单声道、双声道、5.1声道。

音频帧长:音频处理或者压缩所操作的一段音频信息,常见的是10ms,20ms,30ms。

常见的音频格式有:PCMWAVMP3OGGWMARAAPE等。

WAV格式文件所占容量(B) =(取样频率 X量化位数X声道)X 时间 / 8 (字节= 8bit)

WAV文件格式如下:







0 0