Timit SPHERE格式转换
来源:互联网 发布:淘宝上好吃的特产 编辑:程序博客网 时间:2024/06/01 20:49
timit常用来做语音识别及说话人识别,毕竟开源的语音库太少了,格式:16k 16bit pcm编码 完整应该是6300段语音
timit是SPHERE格式的,用的时候需要转换下格式
参考:
http://www.360doc.com/content/17/0718/09/45512753_672245873.shtml
这个是直接替换原始的文件,后面修改下,改成在新的目录生成,免得还要重新整理一遍
1、find_wav.m 查找wav文件
function [ wav_files ] = find_wav( path )%FIND_WAV, find all wav file recursivelywav_files = [];if(isdir(path) == 0) return;endpath_files = dir(path);fileNum = length(path_files);for k= 3:fileNum file = [path,'\', path_files(k).name]; if (path_files(k).isdir == 1) ret = find_wav(file); if(isempty(ret) ~= 1) if(isempty(wav_files)) wav_files = char(ret); else wav_files = char(wav_files, ret); end end elseif strfind(path_files(k).name, '.WAV') if(isempty(wav_files)) wav_files = char(file); else wav_files = char(wav_files, file); end endendend
2、sphere2Common.m
注意:这个程序在运行第二次时会将新生成的文件也处理,可以重新设置存储的路径,不过貌似直接设置不行,要先创建文件夹才行
%SPHERE 文件转换为wav文件%clear all;fs = 16000;files = find_wav('F:\TIMIT\TRAIN');%SPHERE 文件转换为wav文件%clear all;fs = 16000;files = find_wav('F:\TIMIT\TRAIN');for fileIdx = 1:length(files) file = deblank(files(fileIdx,:)); file_splits = regexp(file, '\\', 'split'); newfile = deblank(strcat('F:\TIMIT\TRAIN', '\', file_splits(end-1), '_', file_splits(end))); fileID = fopen(file); newfile_path= newfile{1}; %判断文件头,防止误操作 head = fread(fileID, 1024, 'char*1'); headStr = sprintf('%s',head(1:7)); if(~strcmp(headStr,'NIST_1A')) fclose(fileID); continue; end frewind(fileID); allData = fread(fileID, inf, 'short'); fclose(fileID); % delete(file); wavwrite(allData(513:end)./32768, fs, newfile_path); %SPHERE 文件头1024字节 % fclose(fileID);end
3、check_wav.m
clear all;files = find_wav('.');for fileIdx = 1:length(files) file = files(fileIdx,:); [y, fs, nbits] = wavread(file);%不是wav文件就会报错 if(fs~=16000) fprintf('%s: fs~=16000\n', file); end if(nbits ~= 16) fprintf('%s: nbits ~= 16\n', file); endend
阅读全文
0 0
- Timit SPHERE格式转换
- TIMIT语料库音频格式转换
- Sphere
- TIMIT数据库
- 格式转换
- 格式转换
- 格式转换
- 格式转换
- 格式转换
- 格式转换
- 格式转换
- 格式转换
- 格式转换
- 格式转换
- 格式转换
- 格式转换
- n-sphere
- Sphere SUBLEX
- arm-Xilinx-linux-gnuieabi 交叉编译环境搭建
- Infiniband 驱动安装---(HCA光钎)---mlnx
- CVPR 2017 全部及部分论文解读集锦
- linux 查看tomcat状态和日志
- Java程序员常犯的10个错误
- Timit SPHERE格式转换
- win10系统输入法安装后不能用
- java-day08-Thread-线程控制
- Use blocks and menus
- CodeForces 688C NP-Hard Problem
- springboot (6) 修改默认配置
- kafka入门
- linux中文件数目统计
- 基础母函数1003