实时索引

来源:互联网 发布:博拉网络 编辑:程序博客网 时间:2024/05/01 08:34
  1. 记录修改次数
    • 一个全局的位图结构记录每个文档的当前修改次数,每次修改该次数增1。这样只需要对修改后内容的term的索引拉链进行追加,并在索引中记录当前修改次数,原来的term不需要动。检索的时候在获取索引拉链时比较修改索引中记录的修改次数是否与全局结构的修改次数相同,不同则是“过期”的索引,不再使用。这些过期的索引可以在合并的索引库的时候丢弃。
  2. 大小ID编号方法
    • ID表示全局ID,大ID表。每次文档修改时,都会为文档重编一个大ID(小ID不变),并且将该文档修改之前对应的大ID在位图中置为无效,并且和修改次数方法一样,只追加到新term,旧term不动。检索时,读取term的索引,在全局位图中判断是否有效。过期的索引也可以在合并索引库时丢弃。注意:这里小ID并没有起什么作用,它只是和外部系统的一个接口,放到DI中即可。示检索系统内部ID。一个全局的位图结构记录大ID当前是否有效
原创粉丝点击