Wav格式分析

来源:互联网 发布:网络暴力的电影 编辑:程序博客网 时间:2024/06/01 07:21

看了几篇博客都很好,摘抄一部分做一个记录,同时附上原的地址

WAV格式相关博客:

http://ticktick.blog.51cto.com/823160/1752947

http://blog.csdn.net/gf771115/article/details/45643693


研究生毕设课题是语音识别,可惜导师没有研究过该领域(现在也不明白为什么要开这个题目),旁边同学也没有一起探讨的对象,只能自己吭哧吭哧弄点简单的。

在Matlab环境下,实现了一个简单的用MFCC特征参数去进行端点检测的算法,也用DTW做了语音识别。接下来该做工程了,没有项目背景的条件也只能自己吭哧吭哧弄了.....

由于想找Android方向开发,就争取把工程做到Android上吧~首先要获取语音文件,也就是一个录音功能。Android支持音频采集的类是MediaRecoder,AudioRecord,关于类的说明可见http://blog.csdn.net/gf771115/article/details/45643693。


在上面的网址可以发现,WAV格式接近无损压缩的特性更适合进行语音识别。如果想存WAV格式的文件,就不得不利用AudioRecord获取音频流,然后自己封装成一个WAV格式的音频,同时读取WAV格式音频文件又需要一个读写的程序。网上有很多写好的类(上面提到的地址里也有,但是存在错误),但是基本都存在一定错误。所以本着学习的态度,打算自己写一个Androdi解析与存储WAV音频文件的类。

先从WAV文件的格式下手吧,http://ticktick.blog.51cto.com/823160/1752947

还是这个博主的一篇文章,写的非常好,我就做一个简单的记录好了。


http://s4.51cto.com/wyfs02/M00/7D/AD/wKioL1btPw_xefJSAABiQscQxNA841.png


前44个字节基本都是文件的说明信息,证明这是一个WAV文件,我们要的后面的数据流全都在DATA中,其中40-44数据框中存储的Subchunk2Size是后面Data的长度~


接下来去写一个定义这个格式的类吧~



0 0
原创粉丝点击