Sphinx使用及近实时索引实现
来源:互联网 发布:淘宝礼物精品店 编辑:程序博客网 时间:2024/05/07 02:33
Sphinx介绍
Sphinx是由一个开源的全文检索引擎,功能类似Lucune,用C++编写,可为其他应用提供高速、低空间占用、高结果相关度的全文搜索功能。Sphinx可以非常容易的与SQL数据库和脚本语言集成,当前系统内置MySQL和PostgreSQL数据库数据源的支持,也支持从标准输入读取特定格式的XML数据,通过修改源代码,用户可以自行增加新的数据源(例如:其他类型的DBMS的原生支持)
Sphinx特性
系统组成
整个Sphinx系统由多个可执行程序和一套api组成,这里引用Coreseek(一个基于Sphinx的开源检索引擎,提供了良好的中文支持)的一个结构图做个示例
Sphinx是由一个开源的全文检索引擎,功能类似Lucune,用C++编写,可为其他应用提供高速、低空间占用、高结果相关度的全文搜索功能。Sphinx可以非常容易的与SQL数据库和脚本语言集成,当前系统内置MySQL和PostgreSQL数据库数据源的支持,也支持从标准输入读取特定格式的XML数据,通过修改源代码,用户可以自行增加新的数据源(例如:其他类型的DBMS的原生支持)
Sphinx特性
1:Sphinx支持高速建立索引(可达10MB/秒,而Lucene建立索引的速度是1.8MB/秒)
2:高性能的搜索(在2--4GB的文本数据上,平均每次检索响应时间小于0.1秒)
3:高扩展性(实测最高可对100GB的文本建立索引,单一索引可包含1亿条记录)
4:提供了优秀的相关度算法,基于短语相似度和统计(BM25)的复合Ranking方法
5:支持分布式搜索
6:支持短语搜索
7:可作为MySQL的存储引擎提供搜索服务
8:支持布尔、短语、词语相似度等多种检索模式
9:文档支持多个全文检索字段
系统组成
整个Sphinx系统由多个可执行程序和一套api组成,这里引用Coreseek(一个基于Sphinx的开源检索引擎,提供了良好的中文支持)的一个结构图做个示例
- Sphinx使用及近实时索引实现
- Sphinx使用及近实时索引实现
- Sphinx使用及近实时索引实现
- sphinx 增量索引 实现近实时更新
- sphinx 增量索引 实现近实时更新
- sphinx 增量索引 实现近实时更新
- sphinx 增量索引 实现近实时更新
- sphinx 增量索引 实现近实时更新
- sphinx 增量索引 实现近实时更新
- sphinx 增量索引 实现近实时更新
- sphinx 增量索引 实现近实时更新
- sphinx 增量索引 实现近实时
- sphinx 实现实时索引
- sphinx 增量索引 实现实时更新
- Sphinx实时索引,用增量索引实现索引更新
- Sphinx实时索引
- Sphinx实时索引
- Sphinx实时索引
- Restlet 2.0 边学边写(六)使用html form访问Restlet的PUT和DELETE
- ArrayList和Vector线程安全理解
- hdu 1203 01背包 滚动数组
- Android Robotium自动化测试二
- Solution to Msg.exe “Error 5 getting session names”
- Sphinx使用及近实时索引实现
- Java简单迭代器例子
- Java虚拟机学习
- 超棒的微软Metro风格Logo设计
- ubuntu创建eclipse桌面图标
- Hbase学习笔记(一)
- 开源 免费 java CMS - FreeCMS-标签 infoAttchs .
- Android SharedPreferences问题
- win ce Makefile File !INCLUDE $(_MAKEENVROOT)\makefile.def