语音编码标准

来源：互联网发布：跑跑卡丁车淘宝网编辑：程序博客网时间：2024/05/22 07:57

1. 波形编码

波形编码是最简单也是应用最早的语音编码方法。最基本的一种就是PCM编码，如G.711 建议中的A 律或μ 律。APCM、DPCM和ADPCM也属于波形编码的范畴，使用这些技术的标准有G.721、G.726、G.727 等。波形编码具有实施简单、性能优良的特点，不足是编码带宽往往很难再进一步下降。

2. 预测编码

语音信号是非平稳信号，但在短时间段内（一般是30ms）具有平稳信号的特点，因而对语音信号幅度进行预测编码是一种很自然的做法。最简单的预测是相邻两个样点间求差分，编码差分信号，如G.721。但更广为应用的是语音信号的线性预测编码（LPC）。几乎所有的基于语音信号产生的全极点模型的参数编码器都要用到LPC，如G.728、G.729、G.723.1 建议。

3. 参数编码
参数编码是建立在人类语音产生的全极点模型的理论上，参数编码器传输的编码参数也就是全极点模型的参数- 基频、线谱对、增益。对语音来说，参数编码器的编码效率最高，但对音频信号，参数编码器就不太合适。典型的参数编码器有LPC- 10、LPC-10E，当然，G.729、G.723.1 以及CELP（FS- 1016）等码

本激励声码器都离不开参数编码。

4. 变换编码

一般认为变换编码在语音信号中作用不是很大，但在音频信号中它却是主要的压缩方法。比如，MPEG 伴音压缩算法（含著名的MP3）用到FFT、MDCT 变换，AC- 3 杜比立体声也用到MDCT，G.722.1建议中采用的MLT 变换。在近年来出现的低速率语音编码算法中，STC（正弦变换编码）和WI（波形插值）占有重要的位置，小波变换和Gabor 变换在其中有用武之地。

5. 子带编码

子带编码一般是同波形编码结合使用，如G.722 使用的是SB- ADPCM技术。但子带的划分更多是对频域系数的划分（这可以更好地利用低频带比高频带感觉重要的特点），故子带编码中，往往先要应用某种变换方法得到频域系数，在G.722.1 中使用MLT 变换，系数划分为16 个子带；MPEG 伴音中用FFT 或MDCT 变换，划分的子带多达32 个。

6. 统计编码
统计编码在图像编码中大量应用，但在语音编码中出于对编码器整体性能的考虑（变长编码易引起误码扩散），很少使用。对存在统计冗余的信号来说，统计编码确实可以大大提高编码的效率，所以，近年来出现的音频编码算法中，统计编码又重新得到了重视。MPEG 伴音和G.722.1 建议中采纳了哈夫曼变长编码。