索引的建立 更新策略
来源:互联网 发布:hbase查找数据方式 编辑:程序博客网 时间:2024/05/22 00:35
一、索引的建立分为三种方式:
1.两遍文档倒排法
第一遍文档扫描时完成一些全局信息统计,如文档集合的数量、每个文档的单词数量、词频等
第二遍文档扫描的主要任务是填补每个单词的倒排列表,完全在内存中进行
2.排序倒排法
步骤为:
排序文档ID赋值、单词ID赋值、更新词典、统计词频、构建三元组、三元组排序、写中间结果文件、合并中间结果文件。
3.归并倒排法
二、索引更新
1.完全重建策略
2.再合并策略
3.原地更新策略
4.混合策略
0 0
- 索引的建立 更新策略
- 为什么商业搜索引擎选择的索引更新策略是完全重建策略
- 索引视图的建立
- 索引的建立
- 索引视图的建立
- 索引建立的原则
- 建立索引的原则
- 建立索引的原则
- 索引的建立 实例
- 建立索引的原则
- 索引建立的原则
- 索引建立的原则
- 建立索引的好处
- 索引的建立
- 索引建立的原则
- 建立索引的原则
- mysql 索引的建立
- Lucene索引的建立
- 2014年4月操作系统份额:Windows XP仍然在26%以上,Linux微涨
- java IO(三):数据操作流、合并流、回退流、对象序列化、字符编码问题、压缩流
- PAT A 1005. Spell It Right (20)
- iOS7—Day by day—Day14:Interactive View Controller Transitions
- MakeSpace:什物云存储版Dropbox 融800万美元
- 索引的建立 更新策略
- C# TryParse 和 Parse
- Java 泛型通配符?解惑
- 一直对自定义监听器有疑问,所以转一下,有空理解下
- 【js设计模式笔记---接口】
- 64位linux 系统运行32位程序解决方法
- iOS7—Day by day—Day15:CoreImage Filters
- Hadoop MapReduce2.0(Yarn)
- 解析Jquery取得iframe中元素的几种方法