[转载]MATLAB读取音频文件并进行音频特征提取
来源:互联网 发布:网络犯罪涉黄的现状 编辑:程序博客网 时间:2024/06/09 21:42
受教了
原文地址:MATLAB读取音频文件并进行音频特征提取 作者:愚人
1、用audioread(”);函数读取电脑中的音频文件,参数是音频文件的路径:
[sampledata,FS] = audioread('F:1.mp3');
sampledata保存音频信号数据,FS是音频采样率,MP3格式的采样率一般为44100;
2、判断音频数据是否是双声道,如果是双声道则保留一个声道的数据,用calsample.m文件的函数完成此功能,文件内容如下:
function sample = calsample(sampledata,FS)temp_sample = resample(sampledata,1,FS/11025);[m,n] = size(temp_sample);if (n == 2) sample = temp_sample(:,1);else sample = temp_sample;endend
3、对音频数据进行快速傅里叶变换得到频谱图,并选取scope区域内的能量最大并且能量增幅最大的点作为峰值点,进行特征提取,keypoint.m文件内容如下:
function point = keypoint(sample,scope)%对音频数据进行快速傅里叶变换,得到变换后的数据为b,频率为f,时间为t[b,f,t] = specgram(sample,1024,11025,hanning(1024),256);specgram(sample,1024,11025,hanning(1024),256);%绘制频谱图hold on;energy = abs(b);%根据快速傅里叶变换后的数据进行能量计算%energy = sample;diffenergy = caldiffenergy(energy);%计算能量差分[m,n] = size(energy);%获取能量矩阵的大小%f = (0:4);%t = (0:4);f_unit = max(f)/(length(f)-1);%根据频率点个数计算频率单位长度t_unit = max(t)/(length(t)-1);%根据时间点个数计算时间单位长度k = 1;l = 1;p = 1;num = 1;point.t = 0;point.f = 0;%point结构体数组用来保存峰值点temp.t = 0;temp.f = 0;%temp结构体数组用来保存计算中的临时点count = 0;%count为零表示在当前scope中未找到峰值点x_f=0;y_t=0;plot(x_f,y_t);hold on;for i = 1:m-scope+1 for j = 1:n-scope+1 %找出大小为scope的子矩阵中的最大元素的位置并保存 [x_f,y_t] = find(energy(i:i+scope-1,j:j+scope-1)==max(max(energy(i:i+scope-1,j:j+scope-1)))); x_f = x_f + i - 1; y_t = y_t + j - 1; %找出大小为scope的子矩阵中的差分最大元素的位置并保存 [diffx,diffy] = find(diffenergy(i:i+scope-1,j:j+scope-1)==max(max(diffenergy(i:i+scope-1,j:j+scope-1)))); diffx = diffx + i - 1; diffy = diffy + j - 1; count = 0; %如果最大元素和差分最大元素都为同一个位置则该点为峰值点,保存在temp中 for k = 1:length(x_f) for l = 1:length(diffx) if (x_f(k) == diffx(l)) && (y_t(k) == diffy(l)) temp(num).f = x_f(k) * f_unit; temp(num).t = y_t(k) * t_unit; %plot(temp(num).t,temp(num).f,'.'); num = num + 1; count = 1;%在scope中找到一个峰值点则不再记录其它相同的点 break; end end if count == 1%scope中多个峰值点只保留第一个 break; end end endend%将temp中保存的峰值点画在图上,多个scope中找到的相同峰值点只画一次len = 1;point(1).f = temp(1).f;point(1).t = temp(1).t;plot(point(1).t,point(1).f,'.');for i = 2:num - 1 for j = 1:len if (temp(i).f == point(j).f) && (temp(i).t == point(j).t) break; end end if j == len && (temp(i).f ~= point(j).f) && (temp(i).t ~= point(j).t) len = len + 1; point(len).f = temp(i).f; point(len).t = temp(i).t; plot(point(len).t,point(len).f,'.'); endendhold offend
4、keypoint(sample,scope);函数中用到的caldiffenergy(energy);函数内容在caldiffenergy.m文件中,内容如下:
function diffenergy = caldiffenergy(energy)v = diff(energy');[x,y] = size(v);for i = 1:y zero(i) = 0;enddiffenergy = abs(([zero;v])');end
0 0
- [转载]MATLAB读取音频文件并进行音频特征提取
- 使用opensmile提取音频的特征,得到特征向量,并扔进libsvm中进行分类训练测试
- matlab 读取音频并显示波形
- OpenSMILE 提取音频特征
- Matlab提取文字部分MSER特征并初步分类
- MATLAB特征提取代码
- HOG特征提取 matlab
- matlab图像特征提取
- matlab--图像特征提取
- MATLAB提取区域特征
- matlab 提取HOG特征
- iphone怎样把音频文件写入本地文件,然后从本地文件读取到内存,进行播放音频?
- Caffe提取任意层特征并进行可视化
- Caffe提取任意层特征并进行可视化
- Caffe提取任意层特征并进行可视化
- Caffe入门实验九:caffe提取特征并进行可视化
- Python进行特征提取
- 小波矩特征提取matlab代码
- 无法访问请求的页面,因为该页的相关配置数据无效。
- MySQL 5.7 安装配置(解决启动失败、修改密码失败问题)
- github学习(1)
- 1038. 统计同成绩学生(20)
- LeetCode刷题 (Python) | 125. Valid Palindrome
- [转载]MATLAB读取音频文件并进行音频特征提取
- Unable to start the Genymotion virtual device
- Photoshop选区例子(三)存储选区与载入选区
- HDOJ题目分类
- POJ 1742 Coins
- Android特色服务之传感器
- PPTPServer
- 安卓开发——background与src的区别
- 中国各主要大城市经纬度数据