斯坦福分词训练步骤

来源:互联网 发布:在淘宝订的机票可信吗 编辑:程序博客网 时间:2024/06/05 04:33

首先浏览官网的FAQ:https://nlp.stanford.edu/software/segmenter-faq.html

 

D:\eclipse-workspace\Stanford_segmenter\导入的包>java-cp stanford-segmenter-3.7.0.jar -mx15g edu.stanford.nlp.ie.crf.CRFClassifier-prop ctb.prop -serDictionary dict-chris6.ser.gz -sighanCorporaDict data -trainFilectb.txt -serializeTo newmodel.ser.gz > newmodel.log 2> newmodel.err


准备4样东西

1、ctb.prop

2  dictchris6.ser.gz

3  data(下载的分词的中有,data文件夹)

4  tarin.txt 重新训练用的文本

格式:



0 0
原创粉丝点击