正排索引和倒排索引
来源:互联网 发布:南京江宁区网络问政 编辑:程序博客网 时间:2024/05/17 09:06
正排索引(正向索引)
正排表是以文档的ID为关键字,表中记录文档中每个字的位置信息,查找时扫描表中每个文档中字的信息直到找出所有包含查询关键字的文档。
正排表结构如图1所示,这种组织方法在建立索引的时候结构比较简单,建立比较方便且易于维护;因为索引是基于文档建立的,若是有新的文档加入,直接为该文档建立一个新的索引块,挂接在原来索引文件的后面。若是有文档删除,则直接找到该文档号文档对应的索引信息,将其直接删除。但是在查询的时候需对所有的文档进行扫描以确保没有遗漏,这样就使得检索时间大大延长,检索效率低下。
尽管正排表的工作原理非常的简单,但是由于其检索效率太低,除非在特定情况下,否则实用性价值不大。
倒排索引(反向索引)
倒排表以字或词为关键字进行索引,表中关键字所对应的记录表项记录了出现这个字或词的所有文档,一个表项就是一个字表段,它记录该文档的ID和字符在该文档中出现的位置情况。
由于每个字或词对应的文档数量在动态变化,所以倒排表的建立和维护都较为复杂,但是在查询的时候由于可以一次得到查询关键字所对应的所有文档,所以效率高于正排表。在全文检索中,检索的快速响应是一个最为关键的性能,而索引建立由于在后台进行,尽管效率相对低一些,但不会影响整个搜索引擎的效率。
倒排表的结构图如图2:
正排索引是从文档到关键字的映射(已知文档求关键字),倒排索引是从关键字到文档的映射(已知关键字求文档)。
0 0
- 正排索引和倒排索引
- 正排索引和倒排索引
- 正排索引和倒排索引
- 倒排索引和正排索引
- 正排索引和倒排索引
- 正排索引、倒排索引
- 倒排索引、正排索引系列一
- SEO搜索引擎正排索引和倒排索引的区别
- 倒排索引 和 倒排表
- 倒排索引原理
- 倒排索引
- 倒排索引
- 倒排索引
- 索引 倒排
- 倒排索引
- 倒排索引
- hadoop 倒排索引
- 倒排索引技术
- OpenGL读取Obj模型文件
- AFN框架使用
- win7装双系统遇到的问题
- 实用的代码优化方法
- Stanford机器学习---第三讲. 逻辑回归和过拟合问题的解决 logistic Regression & Regularization
- 正排索引和倒排索引
- SQL Server中OutPut子句的使用
- 函数式编程与面向对象的宗派之争
- ISING模型
- Eclipse的SVN下载地址
- Quart2D-画图
- ant脚本的一些总结
- 笔试算法题解析--二维数组右上到左下打印
- 总线的控制方式