语音识别
来源:互联网 发布:寿百年 黑俄罗斯 淘宝 编辑:程序博客网 时间:2024/04/28 23:15
siri的出现让语音识别一下子很热门啊。下午有空,找几篇语音识别的论文看看。发现语音识别的研究圈子好像比计算机视觉封闭。
像opencv这样的开源库,以及mnist, pascal voc等很容易找到的研究库,语音识别也一时google不出来。
语音识别的英文翻译:speech recognition
另一方面,IBM的viavoice ,微软的语音识别sdk 倒是很容易下载到,似乎是说语音识别是一个商业化程度比较高的研究领域。
比较简单的文章。
1.小词汇量语音识别系统的实现 这个来自pudn网。一个简单的语音识别系统,分端点检测,特征提取和量化,然后由HMM识别。
2.基于MFC 平台下的语音识别系统的设计 百度文档下的。这个文章演示了用ms speech sdk 5.1 创建一个语音识别程序的大致过程。google了下,这个sdk 似乎是2009年以前的
微软现在搞了个tellme。http://www.microsoft.com/en-us/Tellme/developers/default.aspx 这里有个Microsoft Speech Platform 以及更新到10.2了。应该比speech sdk 5.1 先进。
还有一个选择是https://studio.tellme.com/ tellme studio 提供云端服务。用起来,可能很方便。
网站有tellme 和siri的对比试验,看了下siri确实很好用。tellme没有对程序控制做深入的控制,识别率也不差。
曾经用过win7的 tellme 实在是不咋地。
3.汉语大词汇量连续语音识别系统研究进展 汉语的,来自中科院自动化研究所。对语音识别的历史和现状介绍的比较相信。这里提到了NIST ,
http://nist.gov/itl/iad/mig/ 可以申请得到一个测试数据库。。不过要传真申请。一般人估计也不会给。
这里的几个项目都很有趣,比如基于视频检测的超市防偷盗系统。说话人识别,基于多摄像头的特定人跟踪(有数据库可以下载)等等。
这样看下来,还是先了解下微软的tellme studio。今年9月份 ,微软还有一篇整句识别能力大幅度提高的论文。可能到明年,tellme 真会有大进展。
可是tellme studio 已经关闭了free access
- 语音识别
- 语音识别
- 语音识别
- 语音识别
- 语音识别
- 语音识别
- 语音识别
- 语音识别
- 语音识别
- 语音识别
- 语音识别
- 语音识别
- 语音识别
- 语音识别
- 语音识别
- 语音识别
- 语音识别
- 语音识别
- 《VC++深入详解》学习笔记[7]——第8章 对话框(二)
- 《VC++深入详解》学习笔记[8]——第9章 定制应用程序外观
- 《VC++深入详解》学习笔记[9]——第12章 文件和注册表操作
- 《VC++深入详解》学习笔记[10]——第13章 文档与串行化
- CRecordset类的常用成员函数 成员变量 以及操作实例
- 语音识别
- 函数调用 与 内存分配
- ANDROID Porting系列十一Power Management
- eclipse怎么打JAR包
- 软件开发行业经验
- 2011年 中国农业银行 笔试(上机考试)总结
- Android电源管理
- 这些日子的小总结
- python 字符串操作