语音识别中基于规则的语言模型

来源：互联网发布：常用的网络端口号编辑：程序博客网时间：2024/05/16 18:57

语音识别中基于规则的语言模型
一语言模型的选择
语音识别一般分为两个阶段：
1）语音识别阶段：这个阶段利用语音的声学模型，把自然的声音信号转换为机器可以处理的数字表达的音节形式。
2）语音理解阶段：这个阶段把上阶段的结果即音节转换成汉字，这一阶段需使用语言模型的知识进行理解。
而在语音识别中最重要的一部就是建立语言模型，提高语音识别的准确率。
语言模型现在常用的一般可以分为两种：一种是基于大规模语料库的统计语言模型。这种方法的特点是适合处理大规模真实语料 , 数据准备的一致性好，鲁棒性强 , 但由于其实现受系统的空间和时间所限 , 因而只能反映语言的紧邻约束关系，无法处理语言的长距离递归现象。
一种是基于规则的语言模型。这种方法是在对汉语词汇系统按语法语义进行分类的基础上 , 通过确定自然语言的词法、句法及语义关系 , 试图达到同音词的大范围的基本唯一识别。其特点是适于处理封闭语料 , 能够反映语言的长距离约束关系和递归现象 , 但这种方法的鲁棒性差 , 不适合处理开放性语料 , 知识表达的一致性不好。
二词汇分类体系的建立
词类的划分是自然语言理解的基础 , 分类是人类认识事物的一种结果 , 也是人类认识
事物的一种手段。只有对汉语词汇进行系统的语法语义分类 , 才能对整个词汇系统有完
整的认识 , 进行合理的属性标注 , 并在此基础上 , 建立完整系统的规则体系 , 这也会给实际工作带来极大的方便。
按语法进行分类 , 划分比较简单 , 它和句法关系密切 , 只关心基本词性 , 基本上不关
心被表达知识的意义。
) 按语法进行划分 , 把词划分成十一大类 : 名词、动词、形容词、数词、量词、代词、副词、介词、连词、助词和语气词。
2 ) 在语法分类的基础上 , 按照语义对名词类、形容词类、量词类以及动词类进行更深层次的分类 , 分类时尽量考虑建立各种规则的需要 , 视具体情况 , 语义类可分到一
至六层
三规则的表示
规则表示的是汉语句子内各成分之间的结合关系 , 包括语法和语义上的关系。规则由
产生式来表示。这样一个规则体系就是一个产生式体系。上下文无关文法最适合用来描述
自然语言 , 我们采用它来描述系统的产生式规则。
在我们的系统中 , 用下列符号来表示各种语法语义成分 :
S 是起始符 , 代表整个句子 ;
N 、 V 、 A 、 D 、 M 为非终结符 , 分别代表名词、动词、形容词、副词和量词等语法类:
N P 花、 N P 动物、 N P 车、 A P 花、 A P 动物、 A P 车、 V 打、 V 吃、 · 一等为非终结符 ,
分别代表名词、形容词、动词词性的语义类 ;
戮为终结符 , 表示汉语单词。
四规则的获取
规则的获取就是使计算机获得关于语言的知识 , 利角这些知识来理解句子 , 以区别汉
字输入中出现的大量候选字。规则的获取同其他知识获取一样主要有两种途径 :
l ) 人工编辑方式: 由人直接对语言知识进行编辑加工 , 形成规则 , 构成基本知识库 .
2 ) 机器自动获取 : 使系统具有机器学习功能 , 在使用过程中, 根据经验不断学习 , 自
动获取规则 , 逐步完善和丰富知识库 .
我们首先采用人工编辑的方式获取规则以建立基本规则库 , 在此基础上使系统具有机
器学习的功能
五规则模型的实现
我们首先在拼音一汉字转换系统中成功实现了基于规则的语言模型。实现时先把各音节
的同音字归纳成一棵语法、语义树 , 根据匹配规则在树中选择满足条件的汉字串作为音字
转换的结果 3 [ ] 。设有这样一组规则 :
M + % 个十 N P 人一> N P 人
N P 人+ % 是+ N甲人
一
S ( * )
我们输入拼音串 “ w o s i h i y g e b ig n ” , 系统将生成如图 1 所示的树结构

系统根据规则 ) 搜索此树 , 生成汉字串: “ 我是一个兵 ” 。 ( *
单纯使用规则进行匹配存在这样的问题 : 可能有多个汉字串对应该语义树 , 即存在多

个同音字或同音词属于同一语义类。这种问题可以用统计方法来解决

参考文献：哈尔滨工业大学计算机科学与工程系《语音识别中基于规则的语言模型的研究》

1 0