Linux -- Solr 安装/配置

来源:互联网 发布:淘宝售后客服工资算法 编辑:程序博客网 时间:2024/05/19 02:28
http://blog.sina.com.cn/s/blog_5f54f0be0101gzpt.html
由于 solr 基于 lucene, 而 lucene 是基于 java, 所以安装 Solr 前要安装 java:
http://blog.sina.com.cn/s/blog_5f54f0be0100uiu3.html

下载目录:
http://mirror.bit.edu.cn/apache/lucene/solr/

下载后直接解压即可
wget http://mirror.bit.edu.cn/apache/lucene/solr/4.6.0/solr-4.6.0.tgz
tar -xf solr-4.6.0.tgz

假如安装目录是: /usr/local/solr

进入example目录
运行:
java -jar start.jar
这时候查看端口:
netstat -atln
可以看到有一个: 8983 表示 solr 已经启动

这时候访问 web 页面:
http://ip:8983/solr/admin/
即可看到 wolr 的 管理端:
Linux <wbr>-- <wbr>Solr <wbr>安装/配置
同时,还有一个查询端:
http://ip:8983/solr/browse
测试:

1.建立索引。新建一个test.xml文件(我在/usr/local/solr/example/下新建的),内容如下:
    9527
    唐伯虎

2.在/usr/local/solr/example/exampledocs 下执行:

java -jar post.jar /usr/local/solr/example/test.xml

3.在后台查询结果:
Linux <wbr>-- <wbr>Solr <wbr>安装/配置
注意红框处的内容.

4.配置分词
a.下载 ikanalayzer2012:
http://code.google.com/p/ik-analyzer/downloads/list

本例使用 IK Analyer 2012-FF hotfix 1 

该版本可以适用 solr 4.0, 其它版本可能不兼容.
b.下载后,unzip 解压,将 jar 文件复制到 /usr/local/solr/example/solr-webapp/webapp/WEB-INF/lib
并在 /usr/local/solr/example/solr-webapp/webapp/WEB-INF/ 下新建目录: classes
将 stopword.dic 和 IKAnalyzer.cfg.xml 复制到其中.可以在该 xml 中配置其它的扩展词库

c.配置schema.xml文件,路径是:
/usr/local/solr/example/solr/collection1/conf/schema.xml

在众多fieldType当中添加一条

 Linux <wbr>-- <wbr>Solr <wbr>安装/配置

当建立索引时,要对name字段进行分词,在schema.xml中搜索,将其中的 name字段设置:
Linux <wbr>-- <wbr>Solr <wbr>安装/配置

改为: 
type的内容即上面刚设置的一个fieldType: text_ik。
Linux <wbr>-- <wbr>Solr <wbr>安装/配置

当建立索引的时候,name字段将按IK进行分词。 

d.重新启动
e.查看结果
Linux <wbr>-- <wbr>Solr <wbr>安装/配置

0 0