Julius搭建语音识别库
来源:互联网 发布:java工厂方法设计模式 编辑:程序博客网 时间:2024/06/05 16:33
使用Julius搭建一个语音识别引擎这里主要就是听写程序,可以进行一段语音的连续识别,而且主要是针对中文:
一.语音识别引擎的基本结构
基本所有的开源语音识别引擎都是如下的结构,包括:Sphinx,Julius等,下面主要以Julius为例,说明相关的内容:
1.Acoustic Model(声学模型):用于音素的识别。
所使用的技术:
1) HMM(Hiden Mokov Model):
2) GMM(Gaussian Mixture Model):
3)DFA&NFA:
构建自己的声学模型:
可以使用的工具:
2.Phoneme Dictionary(读音词典):用于词语的识别。
构建自己的读音词典:
可以使用的工具:
3.Language Model(语言模型):用于语句的识别。
构建自己的读音词典:
可以使用的工具:
上面的三者3=>2=>1 依次成依赖关系,只要把上面的三者配置好,一个语音识别引擎就搭建好了,其他的就是利用开发包提供API进行客制化开发了。
二.具体操作
以Julius-Voxforge当中的Sample为例,使用Julius主要就是涉及三个文件:
1.sample.grammar:语言文法。
2. sample.voca:读音词典。
3. julian.jconf:语音识别引擎的主要配置文件。在这里指定相面的三大要素.
至于其他文件:
sample.dfa
sample.dict
sample.term
都是通过命令自动生成的---mkdfa.pl sample。
0 0
- Julius搭建语音识别库
- 如何使用Julius搭建一个语音识别引擎?
- 基于JavaScript的在线语音识别库Julius
- julius开源语音识别引擎
- julius开源语音识别引擎
- 基于Julius的机器人语音识别系统构建
- 关于julius开源语音识别 应用的 一些文章
- 语音识别之语音库采集软件---web服务器搭建
- 【语音识别】日语语音识别系统Julius(v4.4)的基于DNN的识别(5月8号:识别结果更新)
- 安装Julius声音识别软件
- Julius孤立词系统搭建
- 语音识别库整理
- android 语音识别库
- htk 搭建语音命令识别工具包
- 使用Tensorflow搭建语音识别系统
- 语音识别
- 语音识别
- 语音识别
- 解决git clone提示Permission denied publickey 问题
- 等待队列
- 在android编程中出现R cannot be resolved to a variable
- GDB+GdbServer: ARM程序调试
- 去除织梦DedeCMS列表和文章分页标签源码中的<li>
- Julius搭建语音识别库
- 二叉树非递归后序遍历
- 【Pyqt4 实例21】实现http下载
- 几类数据结构
- android 4.4 按键分析三
- DedeCMS漏洞之mysql_error_trace.inc日志信息
- Step By Step(C++模板类)
- 第七周项目二电阻并联
- 点双联通+缩点+LCA(HDU3686)