信源编码第一次作业

来源：互联网发布：域名购买后有什么用编辑：程序博客网时间：2024/04/29 15:42

一、视频（图像）压缩基本知识：

所谓视频（图像）编码方式就是指通过特定的压缩技术，将某个视频格式的文件转换成另一种视频格式文件的方式。视频格式有以下几种：AVI格式、DV-AVI、MPEG、DivX、MOV、ASF、WMV、RM、RMVB。视频数据中存在大量的余，主要有：空间冗余、时间冗余、结构冗余、知识冗余、视觉冗余、图像区域的相同性冗余和文理统计冗余。基于这些冗余可以对其进行压缩。JPEG压缩分四个步骤实现：（1）颜色模式转换及采样；（2）DCT变换；（3）量化；（4）编码。这里简单介绍一下颜色模式转换及采样。

RGB色彩系统是我们最常用的表示颜色的方式。JPEG采用的是YUV色彩系统。想要用JPEG基本压缩法处理全彩色图像，得先把RGB颜色模式图像数据，转换为YUVr颜色模式的数据。Y代表亮度，U和V则代表色度、饱和度。通过下列计算公式可完成数据转换:

人类的眼睛对亮度的改变也比对色彩的改变要敏感得多，也就是说Y成份的数据是比较重要的。既然U成份和V成份的数据比较相对不重要，就可以只取部分数据来处理。以增加压缩的比例。JPEG通常有两种采样方式：YUV411和YUV422，它们所代表的意义是Y、U和V三个成份的数据取样比例。用三个图来直观地表示采集的方式吧，以黑点表示采样该像素点的Y分量，以空心圆圈表示采用该像素点的UV分量。

也就是说，对于YUV 4:4:4采样，每一个Y对应一组UV分量。对于YUV 4:2:2采样，每两个Y共用一组UV分量。对于YUV 4:2:0采样，每四个Y共用一组UV分量。

二、音频压缩基本知识：

要在计算机内播放或是处理音频文件，也就是要对声音文件进行数、模转换，这个过程同样由采样和量化构成。人耳朵对音频信号的听觉灵敏度有其其规律性，对于不同频段或不同声压级的伴音有其特殊的敏感特性。在伴音数据压缩过程中，主要应用了听觉阈值及掩蔽效应等听觉心理特性。通常使用三个参数来表示声音：采样位数、采样频率和声道数。在进一步了解音频处理和压缩之前需要明确如下几个概念。

音调：泛指声音的频率信息，人耳的主观感受为声音的低沉（低音）或者尖锐（高音）。

响度：声音的强弱。

采样率：声音信息在由模拟信号转化为数字信号过程中的精确程度，采样率越高，声音信息保留的越多。

采样精度：声音信息在由模拟信号转化为数字信号过程中，表示每一个采样点所需要的字节数，一般为16bit（双字节）表示一个采样点。

声道数：相关的几路声音数量，常见的如单声道、双声道、5.1声道。

音频帧长：音频处理或者压缩所操作的一段音频信息，常见的是10ms,20ms,30ms。

常见的音频格式有：PCM、WAV、MP3、OGG、WMA、RA、APE等。

WAV格式文件所占容量（B) =（取样频率 X量化位数X声道）X 时间 / 8 (字节= 8bit)，

WAV文件格式如下：

0 0