Apache Solr 4.9 和 IKAnalyzer中文分词配置(上)

来源:互联网 发布:阿里云服务器定时重启 编辑:程序博客网 时间:2024/04/30 13:14
  • Apache solr 4.9 下载地址:http://archive.apache.org/dist/lucene/solr/4.9.0/
  • IKAnalyzer 下载地址:https://code.google.com/p/ik-analyzer/

如果地址被墙上不去,可以下载我共享在百度网盘上的

  • 点击下载Apache Solr 4.9 密码: mi4i
  • 点击下载IKAnalyzer 2012FF_hf1.zip 密码: utqv

1、Solr的简单安装

运行Solr需要安装jdk,这里略过。

Solr下载后,放到D盘根目录下,然后点击开始菜单,点击运行,输入cmd回车,输入如下命令:

  1. C:\Users\Administrator>d:
  2. D:\>cd solr-4.9.0/example
  3. D:\>java -jar start.jar  

或者在solr-4.9.0下创建个启动.bat,调试会方便些

  1. @echo off   
  2. title 启动服务   
  3. cd example   
  4. java -jar start.jar   
  5. pause  

访问http://localhost:8983/solr/,如下界面即代表solr安装成功
QQ截图20140808212308

2、Solr配置多核

进入solr-4.9.0\example下,复制collection1文件夹并重命名为collection2,进入collection2\conf,编辑core.properties文件,将name=collection1改为name=collection2,也就是复制后的文件夹名称,多核就配置好了

3、配置IKAnalyzer中文分词

通过上面的IKAnalyzer地址,下载IK Analyzer 2012FF_hf1.zip,将解压后的IKAnalyzer2012FF_u1.jar放到solr-4.9.0\example\solr-webapp\webapp\WEB-INF\lib下,将IKAnalyzer.cfg.xml、stopword.dic放到solr-4.9.0\example\solr-webapp\webapp\WEB-INF\classes下,没有classes文件夹就创建一个。

打开solr-4.9.0\example\solr\collection1\conf\schema.xml文件,粘帖如下代码:

  1. <fieldType name=“text_ik” class=“solr.TextField”>  
  2.     <analyzer class=“org.wltea.analyzer.lucene.IKAnalyzer”/>  
  3. </fieldType>  
  4.   
  5. <field name=“ik” type=“text_ik” indexed=“true” stored=“true” multiValued=“false” />   

重启服务器,也就是启动.bat,然后我们前往http://localhost:8983/solr/#/collection1/analysis,随便打上一段话,比如“随便打些汉字测试分词效果”,记得Analyse Fieldname选择我们刚刚配置的ik,点击Analyse Values按钮
QQ截图20140808221531

这样就分词成功了

下一次我们配置IKAnalyzer的细粒度分词和智能分词

转载请注明:XDPS.org » Apache Solr 4.9 和 IKAnalyzer中文分词配置(上)

0 0