语音识别中基于规则的语言模型

来源:互联网 发布:常用的网络端口号 编辑:程序博客网 时间:2024/05/16 18:57
语音识别中基于规则的语言模型
一 语言模型的选择

语音识别一般分为两个阶段:
1)语音识别阶段:这个阶段利用语音的声学模型,把自然的声音信号转换为机器可以处理的数字表达的音节形式。
2)语音理解阶段:这个阶段把上阶段的结果即音节转换成汉字,这一阶段需使用语言模型的知识进行理解。
而在语音识别中最重要的一部就是建立语言模型,提高语音识别的准确率。
语言模型现在常用的一般可以分为两种:一种是基于大规模语料库的统计语言模型。这种方法的特点是适合处理大规模真实语料 , 数据准备的一致性好,鲁棒性强 , 但由于其实现受系统的空间和时间所限 , 因而只能反映语言的紧邻约束关系,无法处理语言的长距离递 归现象 。 
一种是基于规则的语言模型。这种方法是在对汉语词汇系统按语法语义进行分类 的基础上 , 通过确定 自然语言的词法 、 句法及语义关系 , 试图达到同音词的大范围的基本唯一识别 。 其特点是适于处理封闭语料 , 能够反映语言的长距离约束关系和递归现象 , 但这种方法的鲁棒性差 , 不适合处理开放性语料 , 知识表达的一致性不好 。
二 词汇分类体系的建立
词类的划分是 自然语言理解的基础 , 分类是人类认识事物 的一种结果 , 也是人类认识
事物的一 种手段 。 只有对汉语词汇进行系统的语法语义分类 , 才能对整个词汇系统有完
整 的认识 , 进行合理的属性标注 , 并在此基础上 , 建立完整系统的规则体系 , 这也会给实际工作带来极大的方便。
按语法进行分类 , 划分 比较简单 , 它和句法关系密切 , 只关心基本词性 , 基本上不关
心被表达知识的意义 。 
) 按语法进行划分 , 把词划分成十一大类 : 名词 、 动词 、 形容词 、 数词 、 量词 、 代词 、副词 、 介词 、 连词 、 助词和语气词 。
2 ) 在语法分类 的基础上 , 按照语义对名词类 、 形容词类 、 量词类 以及动词类进行更深层次的分类 , 分类时尽量考虑建立各种规则的需要 , 视具体情况 , 语义类可分到一
至六层
三 规则的表示
规则表示的是汉 语句子 内各成分之间的结合关系 , 包括语法和语义上的关系 。 规则由
产生式来表示 。 这样一 个规则体系就是一个产生式体系 。 上 下文无关文法最适合用来描述
自然语言 , 我们采用它来描述系统的产生式规则 。
在我们的系统中 , 用下列符号来表示各种语法语义成分 :
S 是起始符 , 代表整个句子 ;
N 、 V 、 A 、 D 、 M 为非终结符 , 分别代表名词 、 动词 、 形容词 、 副词和量词等语法类:
N P 花 、 N P 动物 、 N P 车 、 A P 花 、 A P 动物 、 A P 车 、 V 打 、 V 吃 、 · 一等为非终结符 ,
分别代表名词 、 形容词 、 动词词性的语义类 ;
戮 为终结符 , 表示汉语单词 。
四 规则的获取
规则的获取就是使计算机获得关于语言的知识 , 利角 这些知识来理解句子 , 以区别汉
字输入 中出现 的大量候选字 。 规则的获取同其他知识获取一样主要有两种途径 :
l ) 人工 编辑方式: 由人直接对语言知识进行编辑加工 , 形成规则 , 构成基本知识库 .
2 ) 机器 自动获取 : 使系统具有机器学习功能 , 在使用过程中, 根据经验不断学习 , 自
动获取规则 , 逐步完善和丰富知识库 .
我们首先采用人工编辑的方式获取规则以建立基本规则库 , 在此基础上使系统具有机
器学习 的功能
五 规则模型的实现
我 们 首先在拼音一汉字转换系统 中成功实现 了基于规则的语言模型 。 实现时先把各音节
的同音字归纳成一棵语法 、 语义树 , 根据 匹配规则在树 中选择满足条件 的汉字串作为音字
转换的结果 3 [ ] 。 设有这样一组规则 :
M + % 个十 N P 人一> N P 人
N P 人+ % 是+ N甲 人

S ( * )
我们输入拼音串 “ w o s i h i y g e b ig n ” , 系统将生成如图 1 所示的树结构


系统根据规则 ) 搜索此树 , 生成汉字 串: “ 我是一个兵 ” 。 ( *
单纯使用规则进行匹配存在这样 的问题 : 可 能有多个汉字 串对应该语义树 , 即存在多

个同音字或 同音词属于同一语义类 。 这种问题可 以用统计方法来解决


参考文献:哈尔滨工业大学计算机科学与工程系 《语音识别中基于规则的语言模型的研究》

1 0