又开源了一个项目

来源:互联网 发布:mariah carey 知乎 编辑:程序博客网 时间:2024/04/29 04:31

在google  code上又开源了一个项目(http://code.google.com/p/lightwords/ ):

 

lightwords是一个中分分词引擎,用双数组Trie树作为词典结构,采用最短N路径算法构造词图粗切分,后期加工采用隐马尔科夫模型(HMM)进行人名地名识别和词性标注。开发语言是C++。