关于在WP7应用里加入Speech To Text (语音识别) 记录

来源:互联网 发布:java存储数据的方法 编辑:程序博客网 时间:2024/05/16 18:50

这是本人的第一篇文章,大家看看吧,有什么不对的地方还请指出,但请文明发言。。

========================================================================================================

关于代码,由于量有点多,这边传不方便,可以在这里找到

http://download.csdn.net/detail/zhang_pei/6338193


学习WP一个多月了,最近上头的建模终于下来了,功能比预期的多了一些,其中有一个功能就是语音输入,我第一想到的就是TX的那个。

       由于平台要求是在WP7里,也就是不能使用WP8里自带的语音识别方法了,度娘了半天,  也没有个确切的答案,愁啊。

       虽然没有找到单纯的介绍这一块的文章,但也不是没有收获,有一些零零碎碎的东西,拼在一起来就可以实现我想要去效果。


        首先,是看到这里http://blog.csdn.net/dlangu0393/article/details/7214728  才稍稍有点头绪,怎么说呢,虽然用的是QT,但是撇开代码,上面讲的思路还是对的,用的是

GOOGLE的语音识别接口,POST请求,很方便。

     来说一下大概的思路吧:

   一、收集声音数据

   二、编码成GOOGLE接口上能识别的格式

   三、发送,接收,处理(Json数据格式)

  这里是Google Speech API的地址,我用的就是这个:

   http://www.google.com/speech-api/v1/recognize?xjerr=1&client=chromium&lang=zh-CN&maxresults=1

  音频编码格式:

FLAC或WAV或SPEEX

详情见链接文章。



然后,我又看了这两篇    (录音篇)   http://www.2cto.com/kf/201203/122741.html 

                                            (保存篇) http://www.2cto.com/kf/201203/122742.html


刚开始还在纠结,因为接口识别的声音类型很有限(已知的),我又没做过声音的编码,后来一想,上面那篇关于声音保存的文章说得就是把声音保存成WAV,我为什么不截取


他其中的一段,做好编码后,不写入文件而是配合HTTP头,POST到接口上去,经实验,这思路是正确的,感谢上述三篇文章提供者。


讲到这里,思路讲完了,关于代码,由于量有点多,这边传不方便,可以在这里找到

http://download.csdn.net/detail/zhang_pei/6338193





  





原创粉丝点击