Apache Solr 4.9 和 IKAnalyzer中文分词配置（上）

来源：互联网发布：阿里云服务器定时重启编辑：程序博客网时间：2024/04/30 13:14

Apache solr 4.9 下载地址：http://archive.apache.org/dist/lucene/solr/4.9.0/
IKAnalyzer 下载地址：https://code.google.com/p/ik-analyzer/

如果地址被墙上不去，可以下载我共享在百度网盘上的

点击下载Apache Solr 4.9 密码: mi4i
点击下载IKAnalyzer 2012FF_hf1.zip 密码: utqv

1、Solr的简单安装

运行Solr需要安装jdk，这里略过。

Solr下载后，放到D盘根目录下，然后点击开始菜单，点击运行，输入cmd回车，输入如下命令：

C:\Users\Administrator>d:
D:\>cd solr-4.9.0/example
D:\>java -jar start.jar  

或者在solr-4.9.0下创建个启动.bat，调试会方便些

@echo off   
title 启动服务   
cd example   
java -jar start.jar   
pause  

访问http://localhost:8983/solr/，如下界面即代表solr安装成功
QQ截图20140808212308

2、Solr配置多核

进入solr-4.9.0\example下，复制collection1文件夹并重命名为collection2，进入collection2\conf，编辑core.properties文件，将name=collection1改为name=collection2，也就是复制后的文件夹名称，多核就配置好了

3、配置IKAnalyzer中文分词

通过上面的IKAnalyzer地址，下载IK Analyzer 2012FF_hf1.zip，将解压后的IKAnalyzer2012FF_u1.jar放到solr-4.9.0\example\solr-webapp\webapp\WEB-INF\lib下，将IKAnalyzer.cfg.xml、stopword.dic放到solr-4.9.0\example\solr-webapp\webapp\WEB-INF\classes下，没有classes文件夹就创建一个。

打开solr-4.9.0\example\solr\collection1\conf\schema.xml文件，粘帖如下代码：

<fieldType name=“text_ik” class=“solr.TextField”>  
    <analyzer class=“org.wltea.analyzer.lucene.IKAnalyzer”/>  
</fieldType>  
  
<field name=“ik” type=“text_ik” indexed=“true” stored=“true” multiValued=“false” />   

重启服务器，也就是启动.bat，然后我们前往http://localhost:8983/solr/#/collection1/analysis，随便打上一段话，比如“随便打些汉字测试分词效果”，记得Analyse Fieldname选择我们刚刚配置的ik，点击Analyse Values按钮
QQ截图20140808221531

这样就分词成功了

下一次我们配置IKAnalyzer的细粒度分词和智能分词

转载请注明：XDPS.org » Apache Solr 4.9 和 IKAnalyzer中文分词配置（上）

0 0