Bing Speech Api
来源:互联网 发布:js input 隐藏属性 编辑:程序博客网 时间:2024/05/18 01:47
https://github.com/gillesdemey/google-speech-v2/
但是上个Google实在不容易。因而我研究了一下Bing。百度了一下,发现还没什么人写过相关的教程。其实方法也很简单。先贴官网文档的地址:
https://www.microsoft.com/cognitive-services/en-us/speech-api/documentation/api-reference-rest/bingvoicerecognition
官方的文档写的还是很具体的,会用的应该一看就懂。我就在这里做个简单的Tutorial。
0 简述
简单的说就是利用REST API,通过Http接口发起语音认知请求。
具体步骤:获得授权码-->POST语音识别请求-->获得认知结果
免费的Bing Speech服务支持5000次/月的识别请求,单次请求的语音长度不超过10秒。显然,这更适合语音命令识别。不过这里我强行拿来给一般音频文件加字幕。
本文需要用到的工具(cURL和SoX):
链接:https://pan.baidu.com/s/1slRLsYD 密码:mf5t
建议解压后,把两个程序所在的目录均加到系统Path中,以便命令行直接调用。
两个都是开源软件,有兴趣的可以去官网下载源码。
1 获得授权码
- 登陆Bing Speech官网(需要有微软账户):
https://www.microsoft.com/cognitive-services/en-us/speech-api
点击右上角Get started for Free。在API选择栏目中选上Bing Speech。这样就可以免费使用Bing语音识别了。这时,在API管理页面可以看到刚才选中的Bing Speech了。
- 申请授权码需要用到cURL,格式如下(请将YourKey替换为刚才Copy的key):
curl.exe -X POST --header "Content-Length: 0" --header "Ocp-Apim-Subscription-Key:YourKey" "https://api.cognitive.microsoft.com/sts/v1.0/issueToken"
- MP3转WAV(16bit PCM)
sox.exe -V originalMP3.mp3 --encoding signed-integer --bits 16 --channels 1 --rate 16000 newWAV.wav
- 切割音频文件
"originalFile.wav"要切割的源文件sox.exe originalFile.wav trimFile.wav trim 45 10
"test.wav" 处理好的不大于10秒的音频文件curl.exe -X POST --da
ta-binary @test.wav --header "Content-Type: audio/wav; samplerate=16000" --header "Authorization: Bearer access_token" "https://speech.platform.bing.com/recognize?scenarios=catsearch&appid=f84e364c-ec34-4773-a783-73707bd9a585&locale=de-DE&device.os=wp7&version=3.0&format=json&requestid=1d4b6030-9099-11e0-91e4-0800200c9a66&instanceid=1d4b6030-9099-11e0-91e4-0800200c9a66"
执行之后,等待一会儿就可以得到结果。比如:
- Bing Speech Api
- Bing API初体验
- Bing API初体验
- php bing api
- bing 地图api使用
- Microsoft Speech API SDK
- iPhone speech recognition API?
- Google Speech API
- Bing API 2的体验
- bing的搜索api简介
- c#:使用bing翻译API
- HTML5 Speech API和Audio API
- 利用Google Speech API实现Speech To Text
- Bing翻译实例(microsoft translator API)
- 让Python使用Bing翻译API V2
- 让Python使用Bing翻译API V2
- python调用bing翻译API V2
- 利用Bing Search API进行搜索
- 重载overloading和重写overriding的区别
- 一定条件の毎groupの前4件の取得方式
- 让我们成为一个会自己装系统的程序员吧!
- spring-dao配置
- cf758c
- Bing Speech Api
- 3993: [SDOI2015]星际战争
- ubuntu 下出现E: Sub-process /usr/bin/dpkg returned an error code
- android链接mysql的关键
- 数组和链表的区别
- 将数字转换成中文
- 用BeatifulSoup爬取百度贴吧(主楼文字)
- 数据结构复习一:哈希表的总结
- 3992: [SDOI2015]序列统计