Solr

来源:互联网 发布:如花照片软件 编辑:程序博客网 时间:2024/06/07 08:36

下面全部是SolrJ

1.Solr 简介

1.Solr基于倒排索引。

2.Solr索引文件能够放在N个不同的服务器上(Cloud模式)

3.Solr基于HTTP协议

2.Solr 操作(Cloud模式)

1.创建SolrClient(这里能够配置Solr服务参数)

1.因为Solr基于HTTP,所以这里要建立一个HTTPClient,作为中间组件。

2.通过HTTPClient能够配置一些参数:分布式服务器的总连接数量和、每一台单独的服务器的连接数量。

3.因为Solr可以用分布式服务器,所以这里用 LBHttpSolrClient 将 HTTPClient 组件包装成为分布负载均衡的中间组件。

2.创建SolrQuery(这里能够配置每单次操作的参数:关键字、高亮等)

3.操作返回结果集

3.Solr服务器端

1.服务器端直接下载solr6.5.x,可以直接运行启动

2.服务器端能够用127.0.0.1:port/solr页面直接控制服务器端的设置。

3.solr启动可以有不同的启动模式(HTTP、Cloud)

4.Cloud模式下面几个重要的概念:

1.Collection:collection 是一个逻辑索引,客户端搜索的时候只关心collection,其余的solr服务端配合zookeeper会自己处理。

2.shard:collection包含许多shard,shard能够放在不同的服务器节点上。

3.主要就是上述两个概念,但是还有core,replica。(暂时没搞明白)

4.Solr数据结构处理过程

1.输入文档:

1.分词工具分词。

2.进一步规范化词语。

3.在已有的词库(一棵树或者HASH表)找到本次分词产生的词集对应的词节点(如果没有就创建),词节点指向文档列表

4.计算词频(词在本文档中出现的位置),文档插入到适当的位置。

5.剩余问题

1.服务端的field配置,分析配置,collection等系统的理解。

0 0
原创粉丝点击