java ansj5.0.1自定义词典

来源:互联网 发布:淘宝女装店铺标志图片 编辑:程序博客网 时间:2024/05/29 10:30

为了让分词系统更好的识别公司名字,进行了自定义词典实验,具体代码如下:

public static void main(String[] args) {
        // TODO Auto-generated method stub
        
        
                String str = "他来自与百悟科技的北京语言科技公司毕业的大学生,进行一路捞创业" ;  
                  
               
                UserDefineLibrary.insertWord("百悟科技", "nzz", 1000);//自定义词汇、自定义词性  nzz 为自定义的词性
                UserDefineLibrary.insertWord("一路捞", "nzz", 1001);  
                UserDefineLibrary.insertWord("北京语言科技公司", "nzz", 1001);  
                Result terms = ToAnalysis.parse(str);  
                System.out.println("增加自定义词库:" + terms.toString());  

    }


具体输出结果:

增加自定义词库:他/r,来自/v,与/p,百悟科技/nzz,的/uj,北京语言科技公司/nzz,毕业/v,的/uj,大学生/n,,/w,进行/v,一路捞/nzz,创业/v

0 0
原创粉丝点击