视音频数据的数据源分析---音频

来源:互联网 发布:华为无线优化工程师 编辑:程序博客网 时间:2024/04/29 21:48

视音频数据的数据源分析 

与视频数据一样,音频数据在传输之前也要经过压缩来降低码率。一般来说原始音频信流是 PCM 编码的,而研究发现,直接采用 PCM 码流进行存储和传输存在非常大的冗余度。已经证明,在音频无损压缩中,压缩比至少可达 4:1,虽然这远不及视频数据的压缩效率,但是 也能在一定程度上减小源数据的冗余度,节约带宽资源和存储资源。  上面提及了两个处理音频信号的过程,其一是 PCM 编码,另一个是音频数据的压缩。下面 分别介绍这两个处理过程。  
1.PCM编码



上图是 PCM 编码的简要框图,其中: 

 1.防失真滤波器是一个低通滤波器,用于滤出声音频带以外的噪声信号; 

 2.波形编码器即是采样器。 

经过采样、量化、编码后就完成了音频信号的数字化过程。采样就是每隔一段时间间隔读一 次数据,在时间上对原信号离散化。而在量化编码过程中,较之均匀量化,非均匀量化可使 精度不致大幅下降的前提下有效的减少量化比特数。在 PCM 中,存在 u 律 15 折线(北美和 日本等地区采用这种)和 A 律 13 折线(欧洲和中国大陆等地区采用这种)两种压扩方法。   

此外在通信中提高线路利用率的通常还有时分复用和频分复用两种方法。时分复用是指将传 输信道按时间来分割,为每个用户指定一个时间间隔。每个间隔里传输信号的一部分,这样就可以使许多用户同时使用一条传输线路。而频分复用则是指把传输信号的频带分成好几个窄带,每个窄带传送一路信号。


2.音频数据压缩

音频压缩的目的是在保证信号在听觉方面不产生失真的前提下,对原始数据进行尽可能大的 压缩。这就需要最大限度的去除掉原信号中的冗余部分,即那些不能被人耳感知到的信号成 分。这包括了两部分:

a)人耳听觉范围以外的信号;

b)被掩蔽掉的音频信号。 

掩蔽效应是指根据人耳听觉的生理和心理特性,当一个强音信号与一个弱音信号同时存在 时,弱音信号将被强音信号所掩蔽而听不见,这样弱音信号就可以视为冗余信号而不用传送 了。这种掩蔽现象主要表现为频谱掩蔽效应和时域掩蔽效应。

a.频域掩蔽效应:一个较弱的信号被另一个相近频率的较强信号的声音所掩蔽;

b.时域掩蔽效应:一个信号被另一个时间间隔很短的信号所掩蔽,亦称为瞬时掩蔽。 

常见的音频编码标准有 MPEG‐1/2 Layer I,II,III;MPEG‐2 AAC 等等。