ISD9160学习笔记05_ISD9160语音识别代码分析
来源:互联网 发布:淘宝店铺类目修改2016 编辑:程序博客网 时间:2024/06/03 01:42
前言
语音识别是特别酷的功能,ISD9160的核心卖点就是这个语音识别,使用了Cybron VR 算法。
很好奇这颗10块钱以内的IC是如何实现人家百来块钱的方案。且听如下分析。
本文作者twowinter,转载请注明:http://blog.csdn.net/iotisan/
功能分析
语音识别例程中做了21条语音识别模型,只要识别到对应的语音,就从串口输出对应模型的命令ID。
具体21条命令如下:
全开模式 0 显示为1
外出模式 1 显示为2
房间开启 2 。。。
房间关闭 3
单灯变色 4
多灯变色 5
全部变色 6
打开开关 7
关闭开关 8
打开插座 9
关闭插座 10
我要开灯 11
我要关灯 12
打开空调 13
关闭空调 14
温度升高 15
温度降低 16
打开电视 17
关闭电视 18
更换频道 19
降低音量 20
增加音量 21
代码分析
代码主循环的逻辑特别清晰,我把主干抽出来,方便大家理解。
int32_t DoVR_sep(){ Wave_StartRecord(); CSpotter_Reset(hCSpotter); while (1) { nNumSample = Wave_GetSample(&lpsSample); if (CSpotter_AddSample(hCSpotter, lpsSample, nNumSample) == CSPOTTER_SUCCESS){ nID = CSpotter_GetResult(hCSpotter); DrvUART_Write(UART_PORT0,&nID,1); //confid 20150603 } Wave_UnlockSample(&lpsSample); }}
Wave_StartRecord开始录音,Wave_GetSample取出音频数据。
CSpotter_AddSample进行语音识别,CSpotter_GetResult识别出语音命令ID,最后DrvUART_Write吐出ID。
如何修改自定义语音命令
原定计划是修改自定义语音命令,但是发现这块资料很少。对于如何实现语音识别的Cybron VR算法,这块是封装成库,具体是“CSpotterSDK16k24d.lib”。这部分底层核心不开放,是可以理解。但是在具体应用时,使用什么工具来产生具体的声音模型,却一直没能找到对应工具。这块google了很久也没有收获,大联大方面是否有朋友来支持下社区的伙伴呢?
总结
可以看到ISD9160是可以实现本地一些预置的语音命令,基本上可以比的上一些几十块钱的模块。但是如何实现自定义的语音命令,还需要继续研究。
- ISD9160学习笔记05_ISD9160语音识别代码分析
- ISD9160学习笔记04_ISD9160音频编码代码分析
- ISD9160学习笔记01_大联大Nuvoton ISD9160语音识别开发板初体验
- 语音识别学习笔记汇总
- 语音识别学习笔记(一)【概述】
- Kaldi语音识别学习笔记(一)
- 语音识别的技术路线学习笔记
- 【神经网络学习笔记】语音识别-matlab语音信号预处理
- ISD9160学习笔记02_搭建NuMicro开发环境
- ISD9160学习笔记06_玩票项目OpenHamtaro
- ISD9160学习笔记07_硬件设计经验分享
- ISD9160学习笔记08_结项总结
- 中文语音识别代码
- android语音识别代码
- 语音识别代码记录
- 语音学习笔记5------时频分析
- 语音识别提取LPC代码
- 语音识别过程分析1
- Android开发——四大组件之BroadcastReceiver概念
- zk--preface(57)
- Unity Animation采样和自定义属性
- Tomcat的Server.xml虚拟主机和虚拟目录的配置
- 2016-12-22工作日志
- ISD9160学习笔记05_ISD9160语音识别代码分析
- 学会封装自己的class类:
- angular自定义指令templateUrl
- c# 数字转大写中文
- 功角自平衡 摘自张幸浩的《永磁同步电机的低成本控制系统研究》
- Android开发——四大组件BroadcastReceiver实例广播事件的拦截转发
- [LeetCode] Count of Range Sum
- BeanFactory作为Spring容器,程序需要手动获取Bean后处理器,然后手动注册!
- oracle学习之:三种方式查看SQL语句的执行计划