多媒体学习笔记

来源：互联网发布：python调用谷歌浏览器编辑：程序博客网时间：2024/05/21 06:40

1.音频和图形图像的相关概念

音频相关概念

1. 音量：声音的强弱程度，又叫做音强，取决于振幅的大小和强弱。（音量、音调、音色为声音的三要素）

2. 音调：人对声音频率的感觉，取决于声波的基频，基频高，则声音尖锐；基频低，则声音低沉。

3. 音色：由混入基音中的泛音所决定。

4. 声音的带宽：声音信号的频率范围。

5. 需要了解和记忆的频率范围：

人耳能听到的音频范围：20Hz~20kHz。

人的说话声音频范围：300~3400Hz。

低于20Hz的音频叫做次声波，高于20kHz的音频叫做超声波。

6. 采样、采样频率和采样精度的基本概念

采样：把时间连续的模拟信号转换成时间离散、幅度连续的信号。（数字信号是离散的，模拟信号是连续的。）

采样频率：每秒钟采样的次数。

量化精度（量化分辨率）：量化后的样本是用二进制数字表示的，二进制数的位数的多少反映了度量声音波形幅度的精度，成为量化精度。

图形和图像的相关概念

1. 图形和图像的区别

图形（矢量图），放大不会失真。

图像（位图），用点阵来记录信息。

2. 亮度、色调和饱和度

亮度：是光作用于人眼时所引起的明亮程度的感觉，它与被观察物体的发光/反射光强度有关。

色调：当人眼看到一种或多种波长的光时所产生的彩色感觉，它反映颜色的种类，是决定颜色的基本特征。

饱和度：颜色的纯度，即掺入白光的程度，或者说是颜色的深浅程度。对于同一色调的彩色光，饱和度越深，颜色越鲜明，或者说是越纯。

3. 三原色原理

光的三原色RGB（红绿蓝），红绿叠加产生黄色，绿蓝叠加产生青色，蓝红叠加产生品红色，

印刷三原色（品红Magenta、黄Yellow、青Cyan）。

4. 彩色空间

（1） RGB彩色空间

（2） YUV彩色空间，主要应用在电视上面。

（3） CMY彩色空间，主要用于打印。

2.多媒体相关计算问题

2.1.图像文件大小计算

图像文件是采用点阵（像素）来描述的，而在存储时也是针对点阵进行描述的。而每个点阵，我们将采用n位来表示其颜色（可以表示2位数种颜色），位数越高，可以表示的色彩也就越丰富。

条件

示例

说明

知道像素数，位数

每个像素为16位，图像为640*480像素，求容量：

640*480*16/8=614400B

16位，可以表示种颜色，即65535种颜色，也就是每个点需要2个Byte，共有640*480个点。

知道像素数，色数

640*480像素，256色的图像，求容量：

640*480* /8=307200B

256，是，因此每个点需要8位，即1Byte。

b表示位bit，B表示字节byte。

2.2.音频文件的大小计算

音频信息在没有压缩之前，每秒所需的存储量可由下式估算出：

文件的字节数=采样频率（Hz）*量化（采样位数）（位）*声道数/8

而如果要在网络上传输这样的文件，它需要的数据传输率则是每秒的位数，也就是在上一个公式的基础上，将单位由Byte转换成Bit，即将最后的“/8”去掉。

2.3.视频文件大小计算

3.常见的多媒体标准

3.1多媒体数据压缩编码的国际标准

1.MPEG-1，第一部分对音频和视频进行复合编码，第二部分是对视频进行编码的规定，第三部分是对音频进行编码的规定（即MP3），第四部分是检查编码是否符合，第五部分是用C语言实现的完整的编码和解码器。

2.MPEG-2，是1994年推出的压缩标准。是针对于数字电视和高清晰度电视。在传输率及视频、音频方面得到了加强。

3.MPEG-4，是1999年2月份推出的。是针对数字电视及交互式的应用推出的综合性的国际标准。优点：1，基于内容的交互性；2，压缩更加高效；访问性也得到了扩充。

4.MPEG-7，多媒体内容描述接口，是1998年10月提出的。目标是支持多种的音频和视觉的描述。

5.MPEG-21，目的是将不同的协议、标准、技术融合在一起。

（MPEG-3还没有发布即被放弃）

3.2常见的图形格式

（1） BMP，占空间较大。

（2） DIB，支持多种硬件平台，占空间较大。

（3） PCX，带有压缩功能。

（4） DIF，是AutoCAD中的存储方式，是一种矢量图。可以被CorelDraw、3DS等软件调用编辑。

（5） WMF，是微软提出的。文件较小。应用于Office。是矢量图。

（6） GIF，如果颜色少，则比较省空间。能够表现动画。最多只能是256色的图片。

（7） JPEG，压缩比很大，产生的质量较高。压缩算法是余弦函数压缩。JPEG2000使用的是小波算法。

（8） PSD，是Photoshop的文件格式。

（9） CDR，是专用于CorelDraw的文件格式。

（10）PCD，是柯达公司的文件格式。

3.3常见的音频格式

（1） WAVE，是一种没有经过压缩的音波文件。

（2） MOD，该格式里存放乐谱和乐曲使用的各种音色样本。

（3） MP3，是MPEG-1的第三部分定义的（MPEG1-Layer3）。

（4） Real Audio，主要是为了网络传输设计的，压缩比比MP3高了很多。

（5） CD Audio，CD上使用的音频格式，音质能很好的保持原声，文件很大。这种格式是不能编辑的。

（6） MIDI，是所有音频格式中最小的。不能记录复杂的声音，不能记录人声。只能播放音乐。

要把声音记录下来，如果想声音基本不失真，使用的采样频率必须为最高音频的两倍或者两倍以上。（人的声音最高频率为3400Hz。）

3.4常见的视频格式

视频信息在计算机中存放具体格式有很多，常见的有下列几种：

（1） Quicktime，是苹果公司提出来的。

（2） AVI，保证高清晰度的一种格式。

（3） RealMedia，RM格式。

（4） ASF，是微软公司提出来的。使用的MPEG4的压缩算法。图像和音质都不错，压缩比也比较高。

4.压缩技术

数据之所以能够压缩是因为基本原始信源的数据存在着很大的冗余度。一般来说，多媒体数据中存在以下种类的数据冗余。

（1）空间冗余（集合冗余）

（2）时间冗余

（3）视觉冗余：把人看不清楚的点忽略掉。

（4）信息熵冗余：

（5）结构冗余：

（6）知识冗余：

有损压缩和无损压缩

无损压缩：也称为冗余压缩法或熵编码法。

有算压缩：也称为熵压缩法。

无损压缩可以还原，有损压缩不可以还原。

ZIP、WINRAR是无损的；MP3、JPEG是有损的。

0 0