基于matlab-GUI数字音频处理系统（二）

来源：互联网发布：英文网络面试常用口语编辑：程序博客网时间：2024/04/29 20:29

音频输入

该模块主要实现音频录制、音频文件选取、音频播放与暂停、导出音频、音频状态信息的显示，流程如下：
音频输入

音频录制

function record_start_pushbutton_Callback(hObject, eventdata, handles)handles.recObj=audiorecorder(fs,16,1); %采样率，比特率，通道数set(handles.recObj,'StartFcn',{@recordstart_Callback,handles}, ...    'StopFcn',{@recordstop_Callback,handles});record(handles.recObj); % 开始录音guidata(hObject,handles);function record_stop_pushbutton_Callback(hObject, eventdata, handles)stop(handles.recObj); % 停止录音handles.Sample=getaudiodata(handles.recObj);% 获取录音guidata(hObject,handles);

音频录制使用audiorecorder函数，这里只用到它的record，stop，getaudiodata分别开始、停止和获取录音样本。
audiorecorder也具有Timer的属性，这里使用了StartFcn和StopFcn，并分别定义了其回调函数，分别相应地函数中编写程序可以达到显示录制和停止的状态，当然还有更多用法，具体可以help Timer。

我还考虑过动态地显示输入波形，参考了网上例程，主要使用了recordblocking，使用循环一段一段地录制波形并显示波形，如果之后有时间编写一下。

音频文件输入

function file_choose_pushbutton_Callback(hObject, eventdata, handles)[filename,pathname]=uigetfile({'*.wav;*.mp3;*.flac', ...    '音频文件(*.wav,*.mp3,*.flac)'},'选择文件');%弹出选择文件窗口if filename==0    returnelse    handles.Filepath=[pathname,filename];    set(handles.filepath_edit,'string',handles.Filepath);% 显示文件名    [handles.Sample,handles.Fs]=audioread(handles.Filepath);% 读取音频文件    % 若输入音频为双声道，则使用一个通道    samplesize=size(handles.Sample);    if samplesize(2)>1        handles.Sample=handles.Sample(:,1);    endend

uigetfile可以限制需要显示的文件格式，并输出[文件名,路径]，这里注意audioread时要将路径放在前面。使用uigetfile后，如果打开窗口未选取文件直接取消会报错，取消后filename返回为0，需要做一个判断，不能使用isempty。
使用audioread读取音频文件，以数组形式存储样本，纵向为幅值，横向为通道，这里我只是用单声道，如上述代码。

音频播放

handles.player=audioplayer(handles.CSample,handles.Fs);

音频播放与录音相似，使用audioplayer,关于显示播放状态与动态显示播放波形的思路一项。

这里我使用了handles.CSample创建一个样本副本，之后对其进行一些音频处理，播放处理后的音频。

音频输出

该模块用于将处理后的音频输出保存，流程如下：

音频传递

参考前一篇GUI与GUI之间参数传递

音频输出

function generate_pushbutton_Callback(hObject, eventdata, handles)% 生成音频if isempty(filename)||isempty(handles.foldername)    set(handles.state_text,'String','请输入完整信息！');else    audiowrite([handles.foldername,'\',filename,format], ...        handles.putSample, ...        Fs, ...        'BitsPerSample',bps);    guidata(hObject,handles);end

为了保证不出错，需要加一个条件，当参数没有完整输入进行提示。
为了使输出界面默认采样率为输入音频采样率，在putfile_OpeningFcn加入

handles.putFs=varargin{2};str=get(handles.Fs_popupmenu,'String');for val=1:5    if str2double(str{val})==handles.putFs        break    endendset(handles.Fs_popupmenu,'Value',val);

音频分析

该模块用于求样本的均值与方差，绘制时域、频域等波形，流程如下
音频分析

if ~isempty(sample)    sample_length=length(sample);    t=(0:sample_length-1)/fs; % 时间    nfft=pow2(nextpow2(sample_length));% fft点数，基2fft取2的幂次方提高速度    switch wavetype

由于基2fft的采样点数（nfft）需为2的倍数，如果不为整数会自动补零，这样会降低速度，所以这里使用nextpow2和pow2将nfft变为2的倍数。

幅频

case 2    fft_sample=fft(sample,nfft);    y=abs(fft_sample)/nfft;    y0=fftshift(y);% 循环移位，取中间为0    f0=(-nfft/2:nfft/2-1)*(fs/nfft);    plot(ax,f0,y0);

fft
由于fft后得到的是共轭对称的两部分分量，幅值为时域的一半（除了0处直流分量），而由于对序列作dft后能量会增大（原因后面总结），幅值需要除以nfft。再将图像进行循环移位，使图像以零y轴为中心对称。

相频

case 3fft_sample=fft(sample,nfft);f0=(-nfft/2:nfft/2-1)*(fs/nfft);ph_y0=fftshift(fft_sample);phase=unwrap(angle(ph_y0));% 矫正相角跳变范围在pi以内plot(ax,f0,phase);

使用angle求出相频响应后，相位变化在2pi之间，图像像噪声波形一样很乱，难以看出变化趋势，需要使用unwrap函数使得相位变化在pi内，这样图像基本上就是单调的。原理如下图
unwrap

瀑布图

case 5axes(ax);spectrogram(sample,1024,512,nfft,fs);colorbar(ax);

瀑布图即声谱图，使用spectrogram可以直接创建声谱图，但是在GUI中绘制时需要注意添加Toolbar中的Rotation，不然无法显示瀑布图。
spectrogram用到的算法是基于短时傅里叶变换的（SFFT），其主要原理是使用窗函数（Hamming）取短时段样本作fft，不断平移窗，将一个样本分成多个窗。由于加上汉明窗丢失了两边的信息，移窗时和上一位置部分重叠可以得到丢失的信息，这样不断加窗并作fft就近似得到时间、频率、幅度相关联的声谱图。
SFFT
具体格式为：
[S,F,T,P]=spectrogram(x,window,noverlap,nfft,fs)

当无输出时会绘制瀑布图，有输出时输出相应的参数，这里只介绍无输出，各参数介绍如下（具体参考help spectrogram）：
参考仿matlab的spectrogram函数（STFT）

参数含义介绍 x 输入信号 x数据量不要太大，否则运行时间过长或无法运行 window 窗函数当为整数时，使用Hamming窗，值为其长度，窗越小，时域特性越明显，但fft点数越少，频域特性越不明显 noverlap 窗与窗重叠点数默认为窗长一半，值小于窗长，越接近窗长，时域特性越好，运算量也越大 nfft fft采样点数 fs 采样率

关于作DFT后能量增大的理解（作fft后要除nfft）

参考关于FFT的结果为什么要除以N

首先，离散付立叶变换的定义本身比连续付立叶变换少了一个dt(采样时间间隔）；
然后，对于单频率成分的信号来说，经过矩形窗截断后的频谱在其信号频率处将放大T（做谱时间长度）倍，同样，对于相隔较远的多频率成分信号来说，相应的频率成分的幅值均将因截断而被放大T倍。
综合考虑这两种原因的话，也就是说我们用FFT做出的谱实际上是放大了T/dt=N（做谱点数）倍，因此，必须将此结果除以N。

阅读全文

0 0