Solr的概述

来源:互联网 发布:淘宝依视路镜片真假 编辑:程序博客网 时间:2024/06/14 19:55

1. 什么是Solr

Solr Apache下的一个顶级开源项目,采用Java开发,它是基于Lucene的全文搜索服务器。Solr提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展,并对索引、搜索性能进行了优化。

Solr可以独立运行,运行在JettyTomcat等这些Servlet容器中,Solr索引的实现方法很简单,用POST方法向Solr服务器发送一个描述Field及其内容的XML文档,Solr根据xml文档添加、删除、更新索引 。Solr搜索只需要发送HTTP GET请求,然后对Solr返回Xmljson等格式的查询结果进行解析,组织页面布局。Solr不提供构建UI的功能,Solr提供了一个管理界面,通过管理界面可以查询Solr的配置和运行情况。

2.下载

Solr官方网站(http://lucene.apache.org/solr/ )下载Solr4.10.3,根据Solr的运行环境,Linux下需要下载lucene-4.10.3.tgzwindows下需要下载lucene-4.10.3.zip

Solr使用指南可参考:https://wiki.apache.org/solr/FrontPage。

 

下载lucene-4.10.3.zip并解压:

 

 

binsolr的运行脚本

contribsolr的一些贡献软件/插件,用于增强solr的功能。

dist:该目录包含build过程中产生的warjar文件,以及相关的依赖文件。

docssolrAPI文档

examplesolr工程的例子目录:

 example/solr:

   该目录是一个包含了默认配置信息的SolrCore目录。

 example/multicore

   该目录包含了在Solrmulticore中设置的多个Core目录。

 example/webapps:

   该目录中包括一个solr.war,该war可作为solr的运行实例工程。

licensessolr相关的一些许可信息

3.Solr的安装及配置

3.1.运行环境

solr 需要运行在一个Servlet容器中,Solr4.10.3要求jdk使用1.7以上,Solr默认提供Jettyjava写的Servlet容器),本教程使用Tocmat作为Servlet容器,环境如下:

SolrSolr4.10.3

Jdkjdk1.7.0_72

Tomcatapache-tomcat-7.0.53

3.2.Solr整合tomcat

1. dist\solr-4.10.3.war拷贝到Tomcatwebapp目录下改名为solr.war

 

2. 启动tomcat后,solr.war自动解压,将原来的solr.war删除。

 

3. 拷贝example\lib\ext 目录下所有jar包到Tomcatwebapp\solr\WEB-INF\lib目录下

 


4.拷贝log4j.properties文件

 Tomcatwebapps\solr\WEB-INF目录中创建文件classes文件夹,

复制Solr目录下example\resources\log4j.propertiesTomcatwebapps\solr\WEB-INF\classes目录

5.创建solrhome及配置solrcoresolrconfig.xml文件

6.修改Tomcat目录 下webapp\solr\WEB-INF\web.xml文件,如下所示:

设置Solr home

<!--配置jndi告诉solr工程我们的solrhome的位置-->

<env-entry>

<env-entry-name>solr/home</env-entry-name>

<env-entry-value>D:/temp/solr/solrhome</env-entry-value>

<env-entry-type>java.lang.String</env-entry-type>

</env-entry>

4.Solr界面功能






5.安装中文分词器

5.1.安装步骤

5.1.1第一步:配置IKAnalyzerjar

拷贝IKAnalyzer的文件到TomcatSolr目录中

IKAnalyzer2012FF_u1.jar拷贝到Tomcatwebapps/solr/WEB-INF/lib下。

5.1.2.第二步:IKAnalyzer的配置文件

Tomcatwebapps/solr/WEB-INF/下创建classes目录

将IKAnalyzer.cfg.xml、ext_stopword.dic  mydict.dic  copyTomcat

webapps/solr/WEB-INF/classes

注意:ext_stopword.dic mydict.dic必须保存成无BOMutf-8类型。

5.1.3.第三步:修改schema.xml文件

修改schema.xml文件

修改Solrschema.xml文件,添加FieldType

<fieldType name="text_ik" class="solr.TextField">

  <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>

</fieldType>

 

5.1.4.第四步:设置业务系统Field

设置业务系统Field

<field name="item_title" type="text_ik" indexed="true" stored="true"/>

<field name="item_sell_point" type="text_ik" indexed="true" stored="true"/>

<field name="item_price"  type="long" indexed="true" stored="true"/>

<field name="item_image" type="string" indexed="false" stored="true" />

<field name="item_category_name" type="string" indexed="true" stored="true" />

<field name="item_desc" type="text_ik" indexed="true" stored="false" />

 

<field name="item_keywords" type="text_ik" indexed="true" stored="false" multiValued="true"/>

<copyField source="item_title" dest="item_keywords"/>

<copyField source="item_sell_point" dest="item_keywords"/>

<copyField source="item_category_name" dest="item_keywords"/>

<copyField source="item_desc" dest="item_keywords"/>