语音识别技术在树莓派平台上的使用

来源:互联网 发布:幽浮2没有防御矩阵 编辑:程序博客网 时间:2024/04/17 06:44

最近尝试在树莓派上完成一些语音方向的应用,例如像语音唤醒和关键词的识别,前期搜索了一下,可以选择的国内平台有百度语音,科大讯飞, 云之声等。这几家都有自己的开发者开放平台都提供了语音唤醒,语音关键词识别,语音合成等服务。
先尝试了一下百度语音的开发平台,平台提供了常用的语音应用,但是离线识别的话只提供了手机Android和iOS平台的开发SDK,在线识别倒是提供了REST API可以调用在线服务,但是考虑到网络的影响,最后还是放弃了百度平台。
又看了一下云之声平台的内容,发现和百度提供的类似,也都是提供手机平台的方案,或者有现成的硬件解决方案。
最后选择了科大讯飞的语音平台(科大讯飞语音平台),之前也试用过科大讯飞出的手机语音输入法,效果还是不错的。登录到科大讯飞的开发者平台,发现几家的平台流程都大同小异,注册开发者,申请应用appid,下载的SDK内部填写上appid,就可以调用了。
这里写图片描述
科大讯飞的语音技术平台提供了好多语音技术的应用,除了传统的语音唤醒,语音关键词识别,语音合成。还有一下特别有意思的语音应用像:语音读写的语记,声纹识别,语音评测。不过都是基于手机平台的,树莓派没有机会试用…..
回到树莓派的语音识别,我使用的是树莓派3,装的系统是Raspbian-jessie,Raspbian的基础是Debian操作系统,自然希望有Linux平台的语音识别方案,好在科大讯飞提供了各种平台的解决方案,对于语音唤醒,语音关键词识别,语音合成都有linux下的解决方案,下载试用SDK,在电脑上测试试用正常,识别效果和语音合成的效果都很不错。但是在移植到树莓派上时,发现官网提供的SDK内没有包含树莓派的运行库,由于PC和树莓派的CPU架构不同,求助于科大讯飞的技术支持人员,填写完需求后,在2天内就发来了树莓派需要的运行库,在树莓派上的运行结果也是不错的,但是限于树莓派的硬件性能,程序的响应时间比较长,语音合成的花费的时间也长一点。
记录一下科大讯飞语音技术在树莓派上使用时出现的几个错误:

  1. 报10107错误 可能是程序引用了错误的库文件导致,可以将下载的SDK库文件添加到系统环境下/usr/lib
  2. con not find lmsc同样是程序找不到libmsc.so文件,一可以复制这个文件到系统lib目录,二可以设置libmsc.so文件目录为程序的运行库连接目标,进入libmsc.so文件目录export LD_LIBRARY_PATH=$(pwd)
  3. 报10407错误,这个错误有时候出现的很迷,解释是appid和库文件不相符合,重新下载SDK可能解决,如果是试用SDK也可能是用户权限过期。可以联系科大讯飞的技术支持人员解决。
  4. 注意科大讯飞的语音识别的读取音频数据要求单声道 8k或16k采样率 wav或者pcm格式文件。
0 0