正/逆向最大匹配算法

来源:互联网 发布:万网买域名 编辑:程序博客网 时间:2024/05/19 18:45

1.正向最大匹配法

MaxLength:最大词长

Phrase:截取字串

(1) 从输入语句中按正向取长度为MaxLength的字串Phrase

(2)将Phrase与词典相匹配

(3)若匹配成功,则认为该子串为词,与词末处取新字串返回(2)

(4)若匹配失败,则将Phrase长度-2得到减少一个字符的新Phrase,返回(2)

   若Phrase长度已为0,说明词典中查无该词,分词失败



2.逆向最大匹配法

MaxLength:最大词长

SentenceLength:语句长度

Phrase:截取字串

Head:截取字串起始位置
End:结束位置

(1)从输入语句中按逆向取长度为MaxLength的字串Phrase

   (End=SentenceLength   Head=SentenceLength-MaxLength)

(2)将Phrase与词典相匹配

(3)若匹配成功,则认为该字串为词,原字串的End变为Head,新字串的Head为Head-MaxLength,返回(2)

(4)若匹配失败,则End不变,Head+2,返回(2)

    若Phrase长度为0,说明词典中查无该词,分词失败




1 0
原创粉丝点击