sphinx分布式索引简介
来源:互联网 发布:辅助软件是什么意思 编辑:程序博客网 时间:2024/05/01 20:26
搭建coreseek(sphinx+mmseg3)详细安装配置+php之sphinx扩展安装+php调用示例
sphinx分布式索引原理:当searchd收到一个对分布式索引的查询时,它做如下操作:1. 连接到远程代理2. 执行查询3. (在远程代理执行搜索的同时)对本地索引进行查询4. 接收来自远程代理的搜索结果5. 将所有结果合并,删除重复项6. 将合并后的结果返回给客户端在应用程序看来,普通索引和分布式索引完全没有区别。任一个searchd实例可以同时做为主控端(master,对搜索结果做聚合)和从属端(只做本地搜索)。这有如下几点好处:1. 集群中的每台机器都可以做为主控端来搜索整个集群,搜索请求可以在主控端之间获得负载平衡,相当于实现了一种HA(high availability,高可用性),可以应对某个节点失效的情况。2. 如果在单台多CPU或多核机器上使用,一个做为代理对本机进行搜索的searchd实例就可以利用到全部的CPU或者核。更好的HA支持已在计划之中,到时将允许指定哪些代理之间互相备份、有效性检查、跟踪运行中的代理、对检索请求进行负载均衡,等等。sphinx分布式索引配置:index dist1{ # local index to be searched # there can be many local indexes configured local = test1 local = test1stemmed # remote agent # multiple remote agents may be specified # syntax for TCP connections is 'hostname:port:index1,[index2[,...]]' # syntax for local UNIX connections is '/path/to/socket:index1,[index2[,...]]' agent = localhost:9313:remote1 agent = localhost:9314:remote2,remote3 # agent = /var/run/searchd.sock:remote4 # blackhole remote agent, for debugging/testing # network errors and search results will be ignored # agent_blackhole = testbox:9312:testindex1,testindex2 # remote agent connection timeout, milliseconds # optional, default is 1000 ms, ie. 1 sec agent_connect_timeout = 1000 # remote agent query timeout, milliseconds # optional, default is 3000 ms, ie. 3 sec agent_query_timeout = 3000}原理和配置还是比较简单的,对于索引文件过大的情况,分布式索引非常有用。但是碰到搜索量非常大的时候,分布式索引就显得力不从心了。这个时候就需要做索引复制了。索引复制同步的问题一般采用的方案有两种。第一种方案是主从同步。有一个主搜索服务器和多个从搜索服务器。在主搜索服务器上生成的增量索引会同步从索引服务器。从而达到主从同步。为了避免网络或者其他情况导致的增量索引不同步的情况,需要定期在一个阶段把主从服务器的主索引同步一次。新增加搜索服务器的话需要在增量索引生成的间隔数据去拷贝其他搜索服务器的主索引。第二种方案是每个搜索服务器根据增量数据去生成增量索引。通过表来记录不同的搜索服务器是否生成增量索引。来达到同步的目的。新增加搜索服务器的话,就需要去比历史上所有的增量数据全部生成一遍。这两种策略都是可行的。增量数据在一定时间段量很大的话建议用第一种方案,否则用第二种方案。
0 0
- sphinx分布式索引简介
- sphinx分布式索引简介
- sphinx分布式索引简介
- sphinx简介+全文索引
- sphinx分布式
- 实时的分布式sphinx索引配置及使用方法总结
- sphinx简介
- sphinx分布式配置
- Sphinx多线程分布式搜索
- sphinx分布式配置
- sphinx分布式配置
- Sphinx多线程分布式搜索
- sphinx分布式配置
- sphinx 分布式索引报错:no enabled local indexes to search
- 文本索引引擎sphinx
- Sphinx增量索引(转)
- sphinx索引生成
- sphinx 增量索引更新
- HDOJ-2795-Billboard 解题报告
- C# 添加引用问题(转)
- android_Socket
- 学生3门课的总分,平均分,最大值,最小值
- poj 3352 Road Construction
- sphinx分布式索引简介
- C++新手——关于引用遍历
- IOS 各类证书截图步骤
- 关于Rijndael算法的加密
- 顺序栈和链栈的基本操作
- ftp 配置
- UIPageControl
- Reader
- HDU 3507 Print Article 斜率dp