R语言使用分词包错

来源:互联网 发布:火车票造假图片软件 编辑:程序博客网 时间:2024/06/07 06:14

在R语言中使用Rwordseg包的segmentCN函数在分词时,如果出现下面这个错误:

Error in .jcall(analyzer, "S", strfunc, X) : 
  java.lang.NullPointerException


解决方法:

text<-enc2utf8(text) #转utf-8,有些格式它不支持
text<-text[Encoding(text)!='unknown']#清除无法识别的字符
word.message<-segmentCN(text)#分词

OK,这样的话既可以了。

0 0
原创粉丝点击