全文检索技术—Solr

来源:互联网 发布:网络维保年终总结报告 编辑:程序博客网 时间:2024/05/01 18:28
1、什么是Solr
Solr 是Apache下的一个顶级开源项目,采用Java开发,它是基于Lucene的全文搜索服务器。Solr提供了比Lucene更为丰富的查询语言,同时实现了可配置、可扩展,并对索引、搜索性能进行了优化。 
Solr可以独立运行,运行在Jetty、Tomcat等这些Servlet容器中,Solr 索引的实现方法很简单,用 POST 方法向 Solr 服务器发送一个描述 Field 及其内容的 XML 文档,Solr根据xml文档添加、删除、更新索引 。Solr 搜索只需要发送 HTTP GET 请求,然后对 Solr 返回Xml、json等格式的查询结果进行解析,组织页面布局。Solr不提供构建UI的功能,Solr提供了一个管理界面,通过管理界面可以查询Solr的配置和运行情况。

2、Solr和Lucene的区别


3、Solr的安装

第一步:把solr的压缩包解压缩。、
第二步:安装tomcat。
第三步:把solr-4.10.3\dist目录下的solr-4.10.3.war部署到tomcat下。把war包改名为solr.war(改名不是必须的,为了便于访问)
第四步:解压solr.war,启动tomcat自动解压。关闭tomcat,删除solr.war
第五步:把\solr-4.10.3\example\lib\ext目录下的所有的jar包添加到solr工程中。
第六步:需要一个solrhome,solrhome就是solr服务器所有的配置文件存放的目录。可以使用solr-4.10.3\example\solr目录做为solrhome。
第七步:配置solr服务,指定solrhome的位置。告诉solr服务solrhome在哪儿。需要修改solr工程的web.xml文件。
第八步:启动tomcat。访问:http://localhost:8080/solr/


4、Solr后台介绍
4.1、Core Admin
在此功能中可以查看solrcore的情况。
4.2、Core selector
在此处可以选择要管理的solrcore。
4.3、Analysis
分析功能。可以查看分析器的分词效果。
4.4、Dataimport
可以配置dataimport插件把数据库中的数据导入到索引库中。
4.5、Documents
可以使用此功能实现索引库的维护,增删改功能。
4.6、Query
查询索引库。

5、SolrJ的使用
Solr的客户端。
5.1、添加文档:
第一步:创建一个java工程。
第二步:把solrJ相关的jar包添加到工程中。
第三步:使用SolrServer和solr服务端创建一个连接。SolrServer是一个抽象类,单机版使用HttpSolrServer,如果solr集群,使用CloudSolrServer。
第四步:创建一个文档对象SolrInputDocument对象。
第五步:向文档对象中添加域。必须包含id域,域名称必须在schema.xml中定义。
第六步:使用SolrServer对象把文档添加到索引库。
第七步:提交。Commit。
5.2、删除文档:
根据id删除;
根据查询删除
5.3、更新文档:
5.4、查询文档:
简单查询;
复杂查询

0 0
原创粉丝点击