Sphinx全文检索
来源:互联网 发布:java 0xff 编辑:程序博客网 时间:2024/04/30 09:13
Sphinx全文检索
数据总体分为
结构化数据
非结构化数据 称为全文数据
sphinx的检索大体分为两大部分:索引创建(Indexing)和搜索索引(Search)
创建索引:
全文检索的索引创建过程一般有以下几步:
一些需要创建索引的文章(Documents)。
将原文档传给分词组件(Tokenizer)。
将得到的词元(Token)传给语言处理组件(Linguistic Processor)。
将得到的词(Term)传给索引组件(Indexer))。
如何对索引进行搜索
1.用户输入查询语句。
2.对查询语句进行词法分析,语法分析,及语言处理
3.搜索索引,得到符合语法树的文档
4.根据得到的文档和查询语句的相关性,对结果进行排序。
什么是Sphinx
Shpinx是SQL Phrase Index(查询词组索引)的缩写,Sphinx是一个基于SQL的全文检索引擎
Sphinx 全文检索引擎
Coreseek 支持中文的全文检索引擎
优点:
Sphinx创建索引的速度比mysql生成索引的速度要快
缺点:
必须要有主键
主键必须为整型
不负责数据存储
配置不灵活
数据总体分为
结构化数据
非结构化数据 称为全文数据
sphinx的检索大体分为两大部分:索引创建(Indexing)和搜索索引(Search)
创建索引:
全文检索的索引创建过程一般有以下几步:
一些需要创建索引的文章(Documents)。
将原文档传给分词组件(Tokenizer)。
将得到的词元(Token)传给语言处理组件(Linguistic Processor)。
将得到的词(Term)传给索引组件(Indexer))。
如何对索引进行搜索
1.用户输入查询语句。
2.对查询语句进行词法分析,语法分析,及语言处理
3.搜索索引,得到符合语法树的文档
4.根据得到的文档和查询语句的相关性,对结果进行排序。
什么是Sphinx
Shpinx是SQL Phrase Index(查询词组索引)的缩写,Sphinx是一个基于SQL的全文检索引擎
Sphinx 全文检索引擎
Coreseek 支持中文的全文检索引擎
优点:
Sphinx创建索引的速度比mysql生成索引的速度要快
缺点:
必须要有主键
主键必须为整型
不负责数据存储
配置不灵活
- Sphinx全文检索
- Sphinx全文检索引擎
- 全文检索引擎 Sphinx
- sphinx全文检索引擎
- Sphinx全文检索
- 全文检索引擎Sphinx
- 全文检索引擎 Sphinx
- sphinx全文检索工具
- 全文检索引擎 Sphinx
- sphinx全文检索
- coreseek(sphinx)全文检索
- sphinx全文检索类
- Sphinx 全文检索引擎
- sphinx全文检索
- Sphinx 全文收索,检索
- Sphinx全文检索服务器配置
- 【sphinx全文检索】sphinx的基本概念
- Sphinx全文检索引擎和Coreseek全文检索服务器简介
- C++枚举进程的方法
- ubuntu强制安装flash
- 【解惑】这么多技术我该怎么学
- 在web.config里面怎么设置FORMS验证:某几个页面可以匿名访问,其他页面都需要登录
- BNU 0814 C The Captain's Squad
- Sphinx全文检索
- BLAST how to use blastn
- Sphinx安装与测试
- Coreseek安装与测试
- 什么叫做“假学习”?
- BLAST Command Line Applications User Manual
- C++中复制构造函数(深度复制和浅复制(简单叙述))
- C++枚举线程方法
- java生成html