音频编码格式的百家争鸣

来源:互联网 发布:手机能做淘宝链接 编辑:程序博客网 时间:2024/05/15 00:13

花满楼原创,转载须授权。


之前介绍过多媒体的封装格式,也就是容器,而装在容器里面的数据,也有它的格式,因为这个数据是压缩了的,所以叫压缩格式,或者叫编码格式。
音频编码

小白:这个很好理解啊,就是容器有封装格式,数据有编码格式嘛。

花满楼:是的。所以在说音视频格式时,应该根据上下文来判断说的是封装格式还是编码格式。

小白:但是,喂,你放个死灵编码的图片上来,是要吓一吓我吗?

花满楼:so sorry…

本文简单介绍常见的音频编码格式。

百花齐放

小白:so happy,又是百花齐放时候!但你也不用给歌神打广告吧!

编码的目的是为了节省体积或带宽

计算一下,一个4分钟的pcm数据(也就是没有经过压缩的数据)占多大体积?

以44100的采样率、双声道跟16位采样精度(2字节)来计算:44100*2*2*(4*60) = 40.37M。如果没有编码压缩,一个一般的音频文件就占了40m,磁盘容量不足极有可能成为突出问题;如果在网络上传输,那带宽就会成为问题。

那如果经过编码,可以节省多少体积呢?以常见的mp3编码格式来看,按mp3的十分之一的压缩率,可以把40m的大小变成4m大小,节省的体积十分明显。

压缩率可以大概计算出来(以128kbps来算):44100*2*2/(128000/8*1) = 11。

所以,减肥是有必要的。

减肥

(1)pcm

pcm编码
pcm(脉冲编码调制)是特殊的编码格式,因为它没有压缩数据,它是釆集声音时表示电平值的一种格式,也是其它编码格式的原始数据。可参考“音频之岁月留声”中的介绍。

(2)mp3

mp3是mpeg制定的压缩标准。

小白:经常听到mpeg,这是什么东东?

花满楼:这不是个东东,是一个专家组。mpeg,动态图像专家组,从属于ISO标准化组织,主要工作是制定视音频压缩编码标准。还有一个jpeg,是静态图像专家组。mpeg标准的版本:mpeg1/2/4/7/21,没有mpeg3;mpeg2.5是非官方版本,是mpeg2的扩展。

小白:有mp3,那有没有mp1或mp2?

花满楼:有。mp1/mp2/mp3:一般都指mpeg-1 audio layer1/2/3,都是基于mepg1标准。layer1/2/3的区别是编码的复杂度不一样,由低到高,layer3的复杂度最高,使得它编解码时会更耗时耗力,但它编码时可以用更小的体积来达到相同的质量。

小白:那就说mp3并不是指mpeg3标准了?

花满楼:不存在mpeg3标准,mp3是基于mpeg1标准,一般来说mp1与mp2也是基于mpeg1标准。mp3全称是:mpeg-1 audio layer3。

mp3的压缩,大概来说,就是把时域波形转换成频率数据,再把高频段与低频段加大压缩力度(特别是高频段),对不同频段使用不同的压缩比例,为有损压缩,压缩率达1:10或更高。

小白:都在说什么呀?!

(3)aac

aac编码

Advanced Audio Coding,目标是取代mp3,而且似乎真的做到了,现在aac编码格式得到广泛使用(h264搭配aac到处可见)。

aac在mpeg-2与mpeg-4标准中都有涉及。从编码的角度,lc-aac(低复杂度的aac)使用最为广泛,此外还有he-aac(高性能的aac)、main-aac、ssr-aac之类规格的编码格式。

对于aac的封装格式有必要再作详细介绍,因为会引出使用上常见的问题,比如硬件编码、流媒体数据封装之类问题。

(4)ac3

ac3, 全称是Audio Coding version 3,是杜比(Dolby)实验室制定的有损音频编码格式。

ac3广泛应用于5.1声道(前左右、后左右、中低音),也是电影院专属编码格式。

(5)ape/flac

flac编码

ape与flac都是无损压缩,也就是能还原出原始的pcm数据。

ape,全称就是ape,猿的意思,所以也叫Monkey。

flac,Free Lossless Audio Codec(无损音频压缩编码)。

想听高品质的音频,ape与flac是很好的选择。

(6)wma

wma,Windows Media Audio,是微软力推的一种音频格式。wma是有损压缩,压缩率可达1:18,比mp3更高,但未必音质就更好。

(7)amr

amr,Adaptive Multi-Rate,由欧洲通信标准化委员会提出,在移动通信系统中广泛使用的语音标准。

amr(分wb或nb)编码时,支持的参数是有限制的,比如nb最高的采样为8000,比特率最高为12200,声道数为1。

amr最大的特别就是体积小,音质差。在语音通话中(直播或本地存储)经常使用到。

语音通话


多媒体开发,关联阅读

FFmpeg第一次约会

ffplay看直播,简洁是美

摄像头启动,开始监控

调试FFmpeg

组装FFmpeg,为我所用

从视频中抽几张图

流媒体服务器,给你好看

他们都在说的概念

媒体封装格式的时装show

音频之狮吼功

音频之岁月留声


扫描下面的二维码添加好友,请注明csdn,小编拉你到程序员技术讨论群。

欢迎关注我们