全文索引介绍

来源：互联网发布：围巾推荐知乎编辑：程序博客网时间：2024/06/16 17:14

相信所有人都用过百度，谷歌等搜索引擎。在使用过程中，我们会发现“搜索”这个操作的神奇之处，我搜索“IT博客”这个关键词，搜出来的结果会“IT”相关的，有“博客”相关的，有“IT博客”相关的，搜索引擎很智能的将我们我们搜索的词分解开，去查找所有相关的内容。

在某宝，某猫等电商网站的搜索功能中也有这种神奇的能力，而且搜索的速度异常的快。

如何快速的从海量的数据中快速的搜索出我们想要的相关数据，这就是“全文搜索”所要做的事。而sphinx就在这方面做得极为出色。

全文数据索引分类

假设我们想在有以下几条数据：

A moment later, Cohen picked up the phone. ‘Hello?’
She could see the open door of a departmental office. ‘Hello! Excuse me. This is the department of French, isn’t it?’

创建索引有以下几个步骤

如上述源文档得到的词元是：
moment later Cohen picked up 等。

然后将词元传给语言处理组件，将词元转换为最原始的状态，例如：

最后把处理好的词传给索引组件（Indexer）进行索引操作

索引组件主要做这两件事：

经过以上的流程，就形成了一个索引表

0 0