Solr1.4安装配置

来源:互联网 发布:盗墓笔记重启豆瓣知乎 编辑:程序博客网 时间:2024/06/07 02:26

1.   安装Java 虚拟机

2.   下载安装tomcat,版本5.5以上。安装目录:例如D:\mypro\solr,检查tomcat安装。http://localhost:8080/ 正常打开tomcat页面则为安装正确。

3.   找到D:\mypro\solr\conf \server.xml  修改如下:

<Connectorport="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" URIEncoding="UTF-8"/>

4.   下载 solr 发行包解压缩到临时目录 c:\temp\solrZip\

5.   创建solr 运行目录D:\mypro\solr\solr,拷贝c:\temp\solrZip\example\solr\目下所有文件到该目录

6.   从c:\temp\solrZip\dist\找到*solr*.war拷贝到D:\mypro\solr\webapps  重命名 为 solr.war

7.   找到D:\mypro\solr\conf\Catalina\localhost\solr.xml(如果没有该目录以及文件,请新建) 添加内容如下:

<Context docBase="D:\mypro\solr\webapps\solr.war" debug="0" crossContext="true" >  <Environment name="solr/home" type="java.lang.String" value="D:\mypro\solr\sol" override="true" />  </Context>  

8.  启动tomcat 访问http://localhost:8080/solr/admin  正常出现页面,则安装正确

9.  如果要自定义修改索引目录,请修改D:\mypro\solr\solr\conf\solrconfig.xml,找到</dataDir>修改

 <dataDir>${solr.data.dir:D:\mypro\solr\solr\data}</dataDir>


附:

1.       批量生成索引

使用Solr的java 包生成索引:
查看帮助:java -jarpost.jar –help
提交索引(首先要进入命令行,cd进入该索引文件夹,还需将post.jar拷贝到该目录下,执行下面的命令。该命令也可单独提交单个文件,只需把*.xml  改为具体的xml文件名即可):
java -Durl=http://localhost:8080/solr/update -Dcommit=yes -jar post.jar *.xml

2.       中文分词

目前Lucene 的中文分词主要有:

paoding :Lucene 中文分词“庖丁解牛” PaodingAnalysis。

imdict :imdict 智能词典所采用的智能中文分词程序。

mmseg4j : 用 Chih-Hao Tsai 的 MMSeg 算法实现的中文分词器。

ik :采用了特有的“正向迭代最细粒度切分算法“,多子处理器分析模式。

目前我的中文分词采用mmseg4j

参考资料
http://wiki.apache.org/solr/

Solrj使用

http://wiki.apache.org/solr/Solrj

http://www.ibm.com/developerworks/cn/java/j-solr1/
http://www.ibm.com/developerworks/cn/java/j-solr2/

http://www.iteye.com/topic/138594
http://www.iteye.com/topic/250708

http://www.iteye.com/topic/364513
http://www.blogjava.net/RongHao/archive/2007/11/06/158621.html

嵌入式Solr
http://wiki.apache.org/solr/Solrj#EmbeddedSolrServer

 

http://blog.chenlb.com/2009/04/solr-chinese-segment-mmseg4j-use-demo.html

http://www.blogjava.net/aoxj/archive/2010/07/21/326775.html