数字音频基础知识

来源:互联网 发布:自己注册域名 编辑:程序博客网 时间:2024/04/30 12:37

 

一、数字音频基础知识

 

Fourier级数:

任何周期的波形可以分解成多个正弦波,这些正弦波的频率都是整数倍。级数中其他正线波的频率是基础频率的整数倍。基础频率称为一级谐波。

 

PCM:

pulse code modulation,脉冲编码调制,即对波形按照固定周期频率采样。为了保证采样后数据质量,采样频率必须是样本声音最高频率的两倍,这就是Nyquist频率。

样本大小:采样后用于存储振幅级的位数,实际就是脉冲编码的阶梯数,位数越大表明精度越高,这一点学过数字逻辑电路的应该清楚。

 

声音强度:

波形振幅的平方。两个声音强度上的差常以分贝(db)为单位来度量,

 

计算公式如下:

20*log(A1/A2)分贝。A1,A2为两个声音的振幅。如果采样大小为8位,则采样的动态范围为20*log(256)分贝=48db。如果样本大小为16位,则采样动态范围为20*log(65536)大约是96分贝,接近了人听觉极限和痛苦极限,是再线音乐的理想范围。windows同时支持8位和16位的采样大小。

 

二、相关API函数,结构,消息

对于录音设备来说,windows 提供了一组wave***的函数,比较重要的有以下几个:

 

打开录音设备函数

MMRESULT waveInOpen(

 LPHWAVEIN phwi,      //输入设备句柄

 UINT uDeviceID,      //输入设备ID

 LPWAVEFORMATEX pwfx,    //录音格式指针

 DWORD dwCallback,     //处理MM_WIM_***消息的回调函数或窗口句柄,线程ID

 DWORD dwCallbackInstance, 

 DWORD fdwOpen       //处理消息方式的符号位

);

为录音设备准备缓存函数

MMRESULT waveInPrepareHeader( HWAVEIN hwi, LPWAVEHDR pwh, UINT bwh ); 

给输入设备增加一个缓存

MMRESULT waveInAddBuffer( HWAVEIN hwi, LPWAVEHDR pwh, UINT cbwh ); 

开始录音

MMRESULT waveInStart( HWAVEIN hwi ); 

清除缓存

MMRESULT waveInUnprepareHeader( HWAVEIN hwi,LPWAVEHDR pwh, UINT cbwh); 

停止录音

MMRESULT waveInReset( HWAVEIN hwi ); 

关闭录音设备

MMRESULT waveInClose( HWAVEIN hwi ); 

Wave_audio数据格式

typedef struct {

  WORD wFormatTag; //数据格式,一般为WAVE_FORMAT_PCM即脉冲编码

  WORD nChannels; //声道

  DWORD nSamplesPerSec; //采样频率

  DWORD nAvgBytesPerSec; //每秒数据量

  WORD nBlockAlign;

  WORD wBitsPerSample;//样本大小

  WORD cbSize;

} WAVEFORMATEX; 

waveform-audio 缓存格式

typedef struct {

  LPSTR lpData; //内存指针

  DWORD dwBufferLength;//长度

  DWORD dwBytesRecorded; //已录音的字节长度

  DWORD dwUser;

  DWORD dwFlags;

  DWORD dwLoops; //循环次数

  struct wavehdr_tag * lpNext;

  DWORD reserved;

} WAVEHDR; 

相关消息

MM_WIM_OPEN:打开设备时消息,在此期间我们可以进行一些初始化工作

MM_WIM_DATA:当缓存已满或者停止录音时的消息,处理这个消息可以对缓存进行重新分配,实现不限长度录音

MM_WIM_CLOSE:关闭录音设备时的消息。

相对于录音来说,回放就简单的多了,用到的函数主要有以下几个:

打开回放设备

MMRESULT waveOutOpen(

 LPHWAVEOUT phwo,     

 UINT uDeviceID,      

 LPWAVEFORMATEX pwfx,   

 DWORD dwCallback,     

 DWORD dwCallbackInstance, 

 DWORD fdwOpen       

); 

为回放设备准备内存块

MMRESULT waveOutPrepareHeader(

 HWAVEOUT hwo, 

 LPWAVEHDR pwh,

 UINT cbwh   

);

写数据(放音)

MMRESULT waveOutWrite(

 HWAVEOUT hwo, 

 LPWAVEHDR pwh,

 UINT cbwh   

);

相应的也有三个消息,用法跟录音的类似:

 

三、程序设计

 

一个录音程序的简单流程:打开录音设备waveInOpen===>准备wave数据头waveInPrepareHeader===>

准备数据块waveInAddBuffer===>开始录音waveInStart===>停止录音(waveInReset) ===>

关闭录音设备(waveInClose)

当开始录音后当buffer已满时,将收到MM_WIM_DATA消息,处理该消息可以保存已录好数据。

 

回放程序比这个要简单的多: 打开回放设备waveOutOpen===>准备wave数据头waveOutPrepareHeader===>写wave数据waveOutWrite===>

停止放音(waveOutRest) ===>关闭回放设备(waveOutClose)

如何处理MM消息: MSDN告诉我们主要有 CALLBACK_FUNCTION、CALL_BACKTHREAD、CALLBACK_WINDOW 三种方式,常用的是

Thread,window方式。

线程模式

waveInOpen(&hWaveIn,WAVE_MAPPER,&waveform,m_ThreadID,NULL,CALLBACK_THREAD),我们可以继承MFC的CwinThread类,只要相应的处理线程消息即可。

MFC线程消息的宏为:

 

  ON_THREAD_MESSAGE,

可以这样添加消息映射:   ON_THREAD_MESSAGE(MM_WIM_CLOSE, OnMM_WIM_CLOSE) 

窗口模式

类似于线程模式,参见源程序即可。

 

源文档 <http://www.cnblogs.com/sadier/articles/106157.html>