语音编码标准

来源:互联网 发布:跑跑卡丁车淘宝网 编辑:程序博客网 时间:2024/05/22 07:57
1. 波形编码 

    波形编码是最简单也是应用最早的语音编码方法。最基本的一种就是PCM编码,如G.711 建议中的A 律或μ 律。APCM、DPCM和ADPCM也属于波形编码的范畴,使用这些技术的标准有G.721、G.726、G.727 等。波形编码具有实施简单、性能优良的特点,不足是编码带宽往往很难再进一步下降。 


2. 预测编码 

    语音信号是非平稳信号,但在短时间段内(一般是30ms)具有平稳信号的特点,因而对语音信号幅度进行预测编码是一种很自然的做法。最简单的预测是相邻两个样点间求差分,编码差分信号,如G.721。但更广为应用的是语音信号的线性预测编码(LPC)。几乎所有的基于语音信号产生的全极点模型的参数编码器都要用到LPC, 如G.728、G.729、G.723.1 建议。 


3. 参数编码 
    参数编码是建立在人类语音产生的全极点模型的理论上,参数编码器传输的编码参数也就是全极点模型的参数- 基频、线谱对、增益。对语音来说,参数编码器的编码效率最高,但对音频信号,参数编码器就不太合适。典型的参数编码器有LPC- 10、LPC-10E,当然,G.729、G.723.1 以及CELP(FS- 1016)等码 

本激励声码器都离不开参数编码。 


4. 变换编码 

    一般认为变换编码在语音信号中作用不是很大,但在音频信号中它却是主要的压缩方法。比如,MPEG 伴音压缩算法(含著名的MP3) 用到FFT、MDCT 变换,AC- 3 杜比立体声也用到MDCT,G.722.1建议中采用的MLT 变换。在近年来出现的低速率语音编码算法中,STC(正弦变换编码)和WI(波形插值)占有重要的位置,小波变换和Gabor 变换在其中有用武之地。 


5. 子带编码 

    子带编码一般是同波形编码结合使用,如G.722 使用的是SB- ADPCM技术。但子带的划分更多是对频域系数的划分(这可以更好地利用低频带比高频带感觉重要的特点),故子带编码中,往往先要应用某种变换方法得到频域系数,在G.722.1 中使用MLT 变换,系数划分为16 个子带;MPEG 伴音中用FFT 或MDCT 变换,划分的子带多达32 个。 


6. 统计编码 
    统计编码在图像编码中大量应用,但在语音编码中出于对编码器整体性能的考虑(变长编码易引起误码扩散),很少使用。对存在统计冗余的信号来说,统计编码确实可以大大提高编码的效率,所以,近年来出现的音频编码算法中,统计编码又重新得到了重视。MPEG 伴音和G.722.1 建议中采纳了哈夫曼变长编码。
原创粉丝点击