sorl全文检索服务器入门

来源:互联网 发布:易观智库数据准确么 编辑:程序博客网 时间:2024/06/05 07:19

1.什么是solr

Solr 是Apache下的一个顶级开源项目,采用Java开发,它是基于Lucene的全文搜索服务器。

Solr提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展,并对索引、搜索性能进

行了优化。

Solr可以独立运行,运行在Jetty、Tomcat等这些Servlet容器中,Solr 索引的实现方法很简单,

POST 方法向 Solr 服务器发送一个描述 Field 及其内容的 XML 文档,Solr根据xml文档添加、

删除、更新索引。Solr 搜索只需要发送 HTTP GET 请求,然后对 Solr 返回Xml、json等格式的查

询结果进行解析,组织页面布局。Solr不提供构建UI的功能,Solr提供了一个管理界面,通过管理

界面可以查询Solr的配置和运行情况。

1.1.Solr和Lucene的区别

Lucene是一个开放源代码的全文检索引擎工具包,它不是一个完整的全文检索引擎,Lucene

提供了完整的查询引擎和索引引擎,目的是为软件开发人员提供一个简单易用的工具包,以方便的

在目标系统中实现全文检索的功能,或者以Lucene为基础构建全文检索引擎。

 Solr的目标是打造一款企业级的搜索引擎系统,它是一个搜索引擎服务,可以独立运行,通过
Solr可以非常快速的构建企业的搜索引擎,通过Solr也可以高效的完成站内搜索功能。

2.Solr安装及配置

从Solr官方网站(http://lucene.apache.org/solr/)下载Solr4.10.3,根据Solr的运行环境,
Linux下需要下载lucene-4.10.3.tgz,windows下需要下载lucene-4.10.3.zip

3.运行环境

solr 需要运行在一个Servlet容器中,Solr4.10.3要求jdk使用1.7以上,Solr默认提供Jetty(java写的Servlet容器)
例如:Solr4.10.3 jdk1.7.0—72.53 tomcatt:apache-tomcat-7.0


4.整合Tomcat详解

第一步:安装tomcat。D:\temp\apache-tomcat-7.0.53

第二步:把solr的war包复制到tomcat 的webapp目录下。

把\solr-4.10.3\dist\solr-4.10.3.war复制到D:\temp\apache-tomcat-7.0.53\webapps下。

改名为solr.war
第三步:solr.war解压。使用压缩工具解压或者启动tomcat自动解压。解压之后删除solr.war

第四步:把\solr-4.10.3\example\lib\ext目录下的所有的jar包添加到solr工程中

第五步:配置solrHome和solrCore。

1)创建一个solrhome(存放solr所有配置文件的一个文件夹)。\solr-4.10.3\example\solr目录就是一个标准的solrhome。

2)把\solr-4.10.3\example\solr文件夹复制到D:\temp\0108路径下,改名为solrhome,改名不是必须的,是为了便于理解。

3)在solrhome下有一个文件夹叫做collection1这就是一个solrcore。就是一个solr的实例。一个solrcore相当于mysql中一个

数据库。Solrcore之间是相互隔离。

i.        在solrcore中有一个文件夹叫做conf,包含了索引solr实例的配置信息。

ii.       在conf文件夹下有一个solrconfig.xml。配置实例的相关信息。如果使用默认配置可以不用做任何修改。

Xml的配置信息:

Lib:solr服务依赖的扩展包,默认的路径是collection1\lib文件夹,如果没有        就创建一个

dataDir:配置了索引库的存放路径。默认路径是collection1\data文件夹,如                果没有data文件夹,会自动创建。

requestHandler






第六步:告诉solr服务器配置文件也就是solrHome的位置。修改web.xml使用jndi的方式告诉solr服务器。

Solr/home名称必须是固定的


第七步:启动tomcat

第八步:访问http://localhost:8080/solr/