Lucene的Field类型

来源:互联网 发布:软件专业毕业设计课题 编辑:程序博客网 时间:2024/05/30 04:54
 
1.       2.0以前的版本
  • Keyword: Field的值将被保存到索引文件,为Field的值建立索引,建立索引时不需要分词。
  • UnIndexed: Field的值将被保存到索引文件,不为Field的值建立索引,因此不能通过该Field搜索文档。
  • UnStored: Field的值不被保存到索引文件,将Field的值分词后建立索引
  • Text: Field的值分词后建立索引。如果参数为String值将被保存,为Reader值不被保存
2.       2.0版本
  用几个内部类的组合来区分Field的具体类型。
  • Store
²        COMPRESS:压缩保存。用于长文本或二进制数据
²        YES:保存
²        NO:不保存
  • Index
²        NO:不建索引
²        TOKENIZED:分词,建索引
²        UN_TOKENIZED:不分词,建索引
²        NO_NORMS:不分词,建索引。但是Field的值不像通常那样被保存,而是只取一个byte,这样节约存储空间
  • TermVector
²        NO不保存term vectors
²        YES保存term vectors。
²        WITH_POSITIONS保存term vectors。(保存值和token位置信息)
²        WITH_OFFSETS保存term vectors。(保存值和Token的offset)WITH_POSITIONS_OFFSETS:保存term vectors。(保存值和token位置信息和Token的offset)