C++语音识别接口快速入门(Microsoft Speech SDK)
来源:互联网 发布:json汉字 编辑:程序博客网 时间:2024/05/16 14:18
目录
- C语音识别接口快速入门Microsoft Speech SDK
- 目录
- 一安装SDK
- 二新建工程配置环境
- 三语音识别代码
- 1文字转语音
- 2语音转文字
- 源代码下载
- 参考网站
一、安装SDK
安装MicrosoftSpeechPlatformSDK.msi,默认路径安装即可。
下载路径:
http://download.csdn.net/detail/michaelliang12/9510691
二、新建工程,配置环境
设置:
1,属性–配置属性–C/C++–常规–附加包含目录:C:\Program Files\Microsoft SDKs\Speech\v11.0\Include(具体路径与安装路径有关)
2,属性–配置属性–链接器–输入–附加依赖项:sapi.lib;
三、语音识别代码
语音识别接口可分为文字转语音和语音转文字
1、文字转语音
需要添加的头文件:
- 1
- 2
- 3
- 1
- 2
- 3
函数:
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
2、语音转文字
这个稍微麻烦一点,因为需要实时监控麦克风,涉及到windows的消息机制。
(1)首先设置工程属性:
属性–配置属性–C/C++–预处理器–预处理器定义:_WIN32_DCOM;
(2)需要添加的头文件:
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 1
- 2
- 3
- 4
- 5
- 6
- 7
(3)在程序的.h头文件中定义变量
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
(4)创建语音识别初始化函数(程序刚开始执行的时候调用,例如文末示例代码中,将此初始化函数放在对话框初始化消息WM_INITDIALOG的响应代码里)
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
- 54
- 55
- 56
- 57
- 58
- 59
- 60
- 61
- 62
- 63
- 64
- 65
- 66
- 67
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
- 54
- 55
- 56
- 57
- 58
- 59
- 60
- 61
- 62
- 63
- 64
- 65
- 66
- 67
(5)定义消息处理函数
需要和其他的消息处理代码放在一起,如本文代码中,放在文末示例代码的DlgProc()函数尾部。本文整个其他的代码块都可以直接照搬,只需要更改如下的消息反应模块即可
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
(6)修改语法文件
修改CmdCtrl.xml文件,可以提高某些词汇的识别度,对里面的词识别效果会很好多,如人名等。(此外,单独运行exe时也需要将此文件和exe放在同一文件夹内,不放也不会报错,只是语法文件里的词汇识别效果变差)
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
源代码下载
注意,本代码是在原来的项目中截取出来的,但可以独立运行。
Microsoft Speech SDK 安装包下载:
http://download.csdn.net/detail/michaelliang12/9510691
文中示例程序下载(之前下载分数太高,我已经重新上传了新版本,也解决了kincect20.lib报错的问题。由于自己经常在csdn上下东西,也需要积分,需要还是需要各位捧场,2积分。。):
http://download.csdn.net/detail/michaelliang12/9766783
存在的bug:每次运行完程序,Windows的语音识别助手不会自动关闭,需要自己手动关闭。若不关闭,则下次启动程序可能会出错。大家如果有好的解决办法,请联系我,谢了!
参考网站
1,http://www.cnblogs.com/eping/archive/2010/05/23/1742201.html
2,http://blog.csdn.net/pamchen/article/details/7856207
3,http://blog.csdn.net/jmxiaocai/article/details/7036033
4,http://blog.csdn.net/buaalei/article/details/5372544(主要参考)
5,http://blog.csdn.net/itcastcpp/article/details/5313204
6,http://blog.csdn.net/artemisrj/article/details/8723095(MFC的消息处理响应版本)
- C++语音识别接口快速入门(Microsoft Speech SDK)
- C++语音识别接口快速入门(Microsoft Speech SDK)
- C++语音识别接口快速入门(Microsoft Speech SDK)——文字转语音
- Microsoft c++ Speech 识别接口快速入门
- Microsoft Speech Platform SDK,语音识别
- Microsoft Speech SDK 文本语音转换入门
- VC 下Microsoft Speech SDK开发语音识别
- VC 下Microsoft Speech SDK开发语音识别
- VC 下Microsoft Speech SDK开发语音识别
- VC 下Microsoft Speech SDK开发语音识别
- VC 下Microsoft Speech SDK开发语音识别
- Microsoft Speech SDK5.1 语音识别
- windows下使用Microsoft Speech SDK开发包做语音识别
- C++语音识别接口快速入门
- C++ Visual speech Sdk 语音识别
- microsoft speech语音识别技术,语音朗读技术概述
- 使用VC++6.0+microsoft speech API 实现语音识别示例
- C#基于Microsoft Speech SDK Version 5.1 的开发(语音)
- 机器学习---GBDT、xgboost与Light GBM优缺点比较(1)
- View视图绘制的过程原理
- xcode代码块的本地路径(以及github下载地址)
- Spring 如何给static变量赋值
- 优化篇 02. 允许远程桌面连接 ❀ Windows Server 2016
- C++语音识别接口快速入门(Microsoft Speech SDK)
- TP5 Model层 模型操作——指定数据库/表 && 自动写入时间
- PLSQL:[1]plsql中文乱码,显示问号
- 使用pyplot绘制sqrt以及x平方实例代码
- Vue 实现登录拦截(三)
- ThinkPHP分页丢失参数的解决办法
- 界面控件包Essential Studio for Windows Forms 2017 v3发布,增加DocIO内容控件
- python数据保存加载(numpy)
- socket 详解