详解几个常见的语音编解码标准

来源：互联网发布：琴歌指弹淘宝编辑：程序博客网时间：2024/05/20 03:42

语音编解码标准的知识

MPEG-1 audio layer 1
类型：Audio
制定者：MPEG
所需频宽：384kbps（压缩4倍）
特性：编码简单，用于数字盒式录音磁带，2声道，VCD中使用的音频压缩方案就是MPEG-1层Ⅰ。
优点：压缩方式相对时域压缩技术而言要复杂得多，同时编码效率、声音质量也大幅提高，编码延时相应增加。可以达到“完全透明”的声音质量（EBU音质标准）
缺点：频宽要求较高
应用领域：voip
版税方式：Free
备注：MPEG-1声音压缩编码是国际上第一个高保真声音数据压缩的国际标准，它分为三个层次：
--层1(Layer 1)：编码简单，用于数字盒式录音磁带
--层2(Layer 2)：算法复杂度中等，用于数字音频广播(DAB)和VCD等
--层3(Layer 3)：编码复杂，用于互联网上的高质量声音的传输，如MP3音乐压缩10倍

MUSICAM(MPEG-1 audio layer 2,即MP2)
类型：Audio
制定者：MPEG
所需频宽：256～192kbps（压缩6～8倍）
特性：算法复杂度中等，用于数字音频广播(DAB)和VCD等，2声道，而MUSICAM由于其适当的复杂程度和优秀的声音质量，在数字演播室、DAB、DVB等数字节目的制作、交换、存储、传送中得到广泛应用。
优点：压缩方式相对时域压缩技术而言要复杂得多，同时编码效率、声音质量也大幅提高，编码延时相应增加。可以达到“完全透明”的声音质量（EBU音质标准）
缺点：
应用领域：voip
版税方式：Free
备注：同MPEG-1 audio layer 1

MP3(MPEG-1 audio layer 3)
类型：Audio
制定者：MPEG
所需频宽：128～112kbps（压缩10～12倍）
特性：编码复杂，用于互联网上的高质量声音的传输，如MP3音乐压缩10倍，2声道。MP3是在综合MUSICAM和ASPEC的优点的基础上提出的混合压缩技术，在当时的技术条件下，MP3的复杂度显得相对较高，编码不利于实时，但由于MP3在低码率条件下高水准的声音质量，使得它成为软解压及网络广播的宠儿。
优点：压缩比高，适合用于互联网上的传播
缺点：MP3在128KBitrate及以下时，会出现明显的高频丢失
应用领域：voip
版税方式：Free
备注：同MPEG-1 audio layer 1

MPEG-2 audio layer
类型：Audio
制定者：MPEG
所需频宽：与MPEG-1层1，层2，层3相同
特性：MPEG-2的声音压缩编码采用与MPEG-1声音相同的编译码器，层1, 层2和层3的结构也相同，但它能支持5.1声道和7.1声道的环绕立体声。
优点：支持5.1声道和7.1声道的环绕立体声
缺点：
应用领域：voip
版税方式：按个收取
备注：MPEG-2的声音压缩编码采用与MPEG-1声音相同的编译码器，层1, 层2和层3的结构也相同，但它能支持5.1声道和7.1声道的环绕立体声。

Dolby AC-3
类型：Audio
制定者：美国杜比公司
所需频宽：64kbps
特性：提供的环绕立体声系统由5个全频带声道加一个超低音声道组成，6个声道的信息在制作和还原过程中全部数字化，信息损失很少，细节丰富，具有真正的立体声效果，在数字电视、DVD和家庭影院中广泛使用。
优点：环绕立体声，信息损失很少，细节丰富，具有真正的立体声效果
缺点：
应用领域：voip
版税方式：按个收取
备注：杜比数字AC-3（Dolby DigitalAC-3）：美国杜比公司开发的多声道全频带声音编码系统，它提供的环绕立体声系统由5个全频带声道加一个超低音声道组成，6个声道的信息在制作和还原过程中全部数字化，信息损失很少，细节丰富，具有真正的立体声效果，在数字电视、DVD和家庭影院中广泛使用。

PCM编码(原始数字音频信号流)
类型：Audio
制定者：ITU-T
所需频宽：1411.2 Kbps
特性：音源信息完整，但冗余度过大
优点：音源信息保存完整,音质好
缺点：信息量大，体积大，冗余度过大
应用领域：voip
版税方式：Free
备注：在计算机应用中，能够达到最高保真水平的就是PCM编码，被广泛用于素材保存及音乐欣赏，CD、DVD以及我们常见的WAV文件中均有应用。因此，PCM约定俗成了无损编码，因为PCM代表了数字音频中最佳的保真水准，并不意味着PCM就能够确保信号绝对保真，PCM也只能做到最大程度的无限接近。要算一个PCM音频流的码率是一件很轻松的事情，采样率值×采样大小值×声道数bps。一个采样率为44.1KHz，采样大小为16bit，双声道的PCM编码的WAV文件，它的数据速率则为 44.1K×16×2=1411.2 Kbps。我们常见的Audio CD就采用了PCM编码，一张光盘的容量只能容纳72分钟的音乐信息。

WMA(Windows Media Audio)
类型：Audio
制定者：微软公司
所需频宽：320～112kbps（压缩10～12倍）
特性：当Bitrate小于128K时，WMA几乎在同级别的所有有损编码格式中表现得最出色，但似乎128k是WMA一个槛，当Bitrate再往上提升时，不会有太多的音质改变。
优点：当Bitrate小于128K时，WMA最为出色且编码后得到的音频文件很小。
缺点：当Bitrate大于128K时，WMA音质损失过大。WMA标准不开放，由微软掌握。
应用领域：voip
版税方式：按个收取
备注：WMA的全称是Windows MediaAudio，它是微软公司推出的与MP3格式齐名的一种新的音频格式。由于WMA在压缩比和音质方面都超过了MP3，更是远胜于RA(RealAudio)，即使在较低的采样频率下也能产生较好的音质，再加上WMA有微软的Windows MediaPlayer做其强大的后盾，所以一经推出就赢得一片喝彩。

AAC(Advanced Audio Coding，先进音频编码)
类型：Audio
制定者：MPEG
所需频宽：96-128 kbps
特性：AAC可以支持1到48路之间任意数目的音频声道组合、包括15路低频效果声道、配音/多语音声道，以及15路数据。它可同时传送16套节目，每套节目的音频及数据结构可任意规定。
AAC主要可能的应用范围集中在因特网网络传播、数字音频广播，包括卫星直播和数字AM、以及数字电视及影院系统等方面。AAC使用了一种非常灵活的熵编码核心去传输编码频谱数据。具有48 个主要音频通道，16 个低频增强通道，16 个集成数据流, 16 个配音，16 种编排。
优点：支持多种音频声道组合，提供优质的音质
缺点：
应用领域：voip
版税方式：一次性收费
备注：AAC于1997年形成国际标准ISO 13818-7。先进音频编码（Advanced Audio Coding--AAC）开发成功，成为继MPEG-2音频标准（ISO/IEC13818-3）之后的新一代音频压缩标准。
在MPEG-2制订的早期，本来是想将其音频编码部分保持与MPEG-1兼容的。但后来为了适应演播电视的要求而将其定义成为一个可以获得更高质量的多声道音频标准。理所当然地，这个标准是不兼容MPEG-1的，因此被称为MPEG-2AAC。换句话说，从表面上看，要制作和播放AAC，都需要使用与MP3完全不同的工具。

分享几个采用AAC音频编码标准的视频开发包：

http://download.csdn.net/detail/aoliaoaoao/4981727
http://download.csdn.net/detail/aoliaoaoao/4983918
http://download.csdn.net/detail/aoliaoaoao/4983892
http://download.csdn.net/detail/aoliaoaoao/4983874