java分词程序

来源:互联网 发布:js的window对象 编辑:程序博客网 时间:2024/06/06 18:40
import java.io.StringReader;
import com.webssky.jcseg.core.*;
public class tet {
public static void main(String[] args) throws Exception{
JcsegTaskConfig config = new JcsegTaskConfig();
ADictionary dic = DictionaryFactory.createDefaultDictionary(config);
dic.loadFromLexiconDirectory("java/lex-main.lex");

ISegment seg = SegmentFactory.createJcseg(JcsegTaskConfig.COMPLEX_MODE,new Object[]{config, dic});

//被分词的字符串

String str = "研究生命起源。";
seg.reset(new StringReader(str));

IWord word = null;

//打印分好的词

while ( (word = seg.next()) != null ) {
System.out.println(word.getValue());
}
}

}

这里提供分词算法的词库

点击打开链接

这里提供分词算法的jar包

点击打开链接

PS:在桌面上新建名为lexicon的文件夹,将lex-mian.lex放在里面,加载jar包即可运行。

原创粉丝点击