语音识别技术在树莓派平台上的使用

来源：互联网发布：幽浮2没有防御矩阵编辑：程序博客网时间：2024/04/17 06:44

最近尝试在树莓派上完成一些语音方向的应用，例如像语音唤醒和关键词的识别，前期搜索了一下，可以选择的国内平台有百度语音，科大讯飞，云之声等。这几家都有自己的开发者开放平台都提供了语音唤醒，语音关键词识别，语音合成等服务。
先尝试了一下百度语音的开发平台，平台提供了常用的语音应用，但是离线识别的话只提供了手机Android和iOS平台的开发SDK，在线识别倒是提供了REST API可以调用在线服务，但是考虑到网络的影响，最后还是放弃了百度平台。
又看了一下云之声平台的内容，发现和百度提供的类似，也都是提供手机平台的方案，或者有现成的硬件解决方案。
最后选择了科大讯飞的语音平台(科大讯飞语音平台)，之前也试用过科大讯飞出的手机语音输入法，效果还是不错的。登录到科大讯飞的开发者平台，发现几家的平台流程都大同小异，注册开发者，申请应用appid，下载的SDK内部填写上appid，就可以调用了。
这里写图片描述
科大讯飞的语音技术平台提供了好多语音技术的应用，除了传统的语音唤醒，语音关键词识别，语音合成。还有一下特别有意思的语音应用像:语音读写的语记，声纹识别，语音评测。不过都是基于手机平台的，树莓派没有机会试用…..
回到树莓派的语音识别，我使用的是树莓派3，装的系统是Raspbian-jessie，Raspbian的基础是Debian操作系统，自然希望有Linux平台的语音识别方案，好在科大讯飞提供了各种平台的解决方案，对于语音唤醒，语音关键词识别，语音合成都有linux下的解决方案，下载试用SDK，在电脑上测试试用正常，识别效果和语音合成的效果都很不错。但是在移植到树莓派上时，发现官网提供的SDK内没有包含树莓派的运行库，由于PC和树莓派的CPU架构不同，求助于科大讯飞的技术支持人员，填写完需求后，在2天内就发来了树莓派需要的运行库，在树莓派上的运行结果也是不错的，但是限于树莓派的硬件性能，程序的响应时间比较长，语音合成的花费的时间也长一点。
记录一下科大讯飞语音技术在树莓派上使用时出现的几个错误：

报10107错误可能是程序引用了错误的库文件导致，可以将下载的SDK库文件添加到系统环境下/usr/lib
报con not find lmsc同样是程序找不到libmsc.so文件，一可以复制这个文件到系统lib目录，二可以设置libmsc.so文件目录为程序的运行库连接目标，进入libmsc.so文件目录export LD_LIBRARY_PATH=$(pwd)
报10407错误，这个错误有时候出现的很迷，解释是appid和库文件不相符合，重新下载SDK可能解决，如果是试用SDK也可能是用户权限过期。可以联系科大讯飞的技术支持人员解决。
注意科大讯飞的语音识别的读取音频数据要求单声道 8k或16k采样率 wav或者pcm格式文件。

0 0