Linux ALSA音频框架分析一：数字音频简介

来源：互联网发布：数控车床车圆弧编程编辑：程序博客网时间：2024/06/06 23:51

Linux ALSA音频框架分析一：数字音频简介

声音在自然界以声波的形式存在，是一系列连续变化的模拟信号，声音的三个要素是音调、音强和音色。声波有三个重要参数：频率 ω0、幅度A n 和相位ψn ，这也就决定了音频信号的特征。根据声波的特征，可把音频信息分类为规则音频和不规则声音。其中规则音频又可以分为语音、音乐和音效。音频信号是（Audio）带有语音、音乐和音效的有规律的声波的频率、幅度变化信息载体。

数字音频是一种利用数字化手段对声音进行录制、存放、编辑、压缩或播放的技术，它是随着数字信字音频号处理技术、计算机技术、多媒体技术的发展而形成的一种全新的声音处理手段。数字音频计算机数据的存储是以0、1的形式存取的，那么数字音频就是首先将音频文件转化，接着再将这些电平信号转化成二进制数据保存，播放的时候就把这些数据转换为模拟的电平信号再送到喇叭播出，数字声音和一般磁带、广播、电视中的声音就存储播放方式而言有着本质区别。相比而言，它具有存储方便、存储成本低廉、存储和传输的过程中没有声音的失真、编辑和处理非常方便等特点。

数字音频文件是通过声音录入设备录制的原始声音，直接记录了真实声音的二进制采样数据，有些文件并对原始数据进行了频率过滤和存储格式压缩，音频文件格式主要分有损和无损两类。有损文件格式是基于声学心理学的模型，除去人类很难或根本听不到的声音。
无损格式，例如PCM，WAV，ALS，ALAC，TAK，FLAC，APE，WavPack(WV)
有损格式，例如MP3，AAC，WMA，Ogg
数字音频文件几个重要参数：采样频率、量化位宽、声道数。

采样频率

采样频率是指将模拟声音波形进行数字化时，每秒钟抽取声波幅度样本的次数。采样频率的选择应该遵循奈奎斯特（Harry Nyquist）采样理论：如果对某一模拟信号进行采样，则采样后可还原的最高信号频率只有采样频率的一半，或者说只要采样频率高于输入信号最高频率的两倍，就能从采样信号系列重构原始信号。正常人听觉的频率范围大约在20Hz~20kHz之间，根据奈奎斯特采样理论，为了保证声音不失真，采样频率应该在40kHz左右。
常用的采样率有：
8,000 Hz - 电话所用采样率,对于人的说话已经足够
11,025 Hz
22,050 Hz - 无线电广播所用采样率
32,000 Hz - miniDV 数码视频camcorder、DAT (LP mode)所用采样率
44,100 Hz - 音频CD,也常用于MPEG-1音频（VCD, SVCD, MP3）所用采样率
47,250 Hz - 商用 PCM 录音机所用采样率
48,000 Hz - miniDV、数字电视、DVD、DAT、电影和专业音频所用的数字声音所用采样率
50,000 Hz - 商用数字录音机所用采样率
96,000 或者 192,000 Hz - DVD-Audio、一些LPCM DVD音轨、BD-ROM（蓝光盘）音轨、和HDDVD（高清晰度DVD）音轨所用所用采样率
2.8224 MHz - Direct Stream Digital 的1位sigma-delta modulation过程所用采样率。

量化位宽

量化位宽是对模拟音频信号的幅度进行数字化，它决定了模拟信号数字化以后的动态范围，常用的有8位、12位、16位、24位和32位。量化位越高，信号的动态范围越大，数字化后的音频信号就越可能接近原始信号，但所需要的存贮空间也越大。

声道数

声道数是反映音频数字化质量的另一个重要因素，声道技术已广泛运用于各类传统影院和家庭影院中。
1）单声道的声道数为1个声道；
2）双声道的声道数为2个声道，立体声道的声道数默认为2个声道；
3）四声道环绕规定了4个发音点：前左、前右，后左、后右，4.1声道音箱系统其中“.1”声道，则是一个专门设计的超低音声道，这一声道可以产生频响范围20～120Hz的超低音。
4）5.1声音系统其实来源于4.1环绕，不同之处在于它增加了一个中置单元。这个中置单元负责传送低于80Hz的声音信号，在欣赏影片时有利于加强人声，把对话集中在整个声场的中部，以增加整体效果。
5）7.1系统已经出现，它在5.1的基础上又增加了中左和中右两个发音点，以求达到更加完美的境界。

阅读全文

0 0