IK中文分词包导入项目步骤

来源:互联网 发布:淘宝如何提高销量 编辑:程序博客网 时间:2024/05/16 06:07

前面说了"庖丁"分词工具包的使用:http://blog.csdn.net/Pc620/archive/2011/03/26/6280489.aspx

 

下面讲讲IK分词包导入eclipse项目的步骤:

 

   ①将IK文件夹拷到工程的根文件夹下,并在MyEclipse中右键单击IK文件夹,选择Built Path->Use as Sourse Forlder

   ②在根目录下建lib文件夹,将4jar包放入lib文件夹下,并选择Built Path->Use as Sourse Forlder并注意还要在MyEclipse中右键单击工程,选择Properties->Java Build Path,在Libraries中选”Add JARs…”导入这4jar包。

   ③还要修改JUnit:右键单击项目,选择Built Path->Add Libraries,选择JUnit,点Next,将JUnit library versionJUnit3改为JUnit4

  

到此,IK分词导入成功,可以通过函数调用它了。

 

 

调用代码示例:

 String docText = "...";

 Analyzer analyzer = new SmartChineseAnalyzer(Version.LUCENE_30);
 TokenStream tokenStream = analyzer.tokenStream(docText, new StringReader(docText));

     

 try 
 {
     while (tokenStream.incrementToken()) 
     {
         TermAttribute termAtt = tokenStream.getAttribute(TermAttribute.class);
          ...
     }
  } 
  catch (IOException e) 
  {
       e.printStackTrace();
  }

原创粉丝点击