Lucene中Field的类型

来源：互联网发布：肖恩坎普身体数据编辑：程序博客网时间：2024/04/29 08:56

1. 2.0 以前的版本
Keyword: Field 的值将被保存到索引文件，为Field的值建立索引，建立索引时不需要分词。
UnIndexed: Field 的值将被保存到索引文件，不为Field的值建立索引，因此不能通过该Field搜索文档。
UnStored: Field 的值不被保存到索引文件，将Field的值分词后建立索引
Text: Field 的值分词后建立索引。如果参数为String值将被保存，为Reader值不被保存
2. 2.0 版本

用几个内部类的组合来区分Field的具体类型。

Store
² COMPRESS: 压缩保存。用于长文本或二进制数据

² YES ：保存

² NO ：不保存

Index
² NO ：不建索引

² TOKENIZED ：分词，建索引

² UN_TOKENIZED ：不分词，建索引

² NO_NORMS ：不分词，建索引。但是Field的值不像通常那样被保存，而是只取一个byte，这样节约存储空间

TermVector
² NO ：不保存term vectors

² YES ：保存term vectors。

² WITH_POSITIONS ：保存term vectors。（保存值和token位置信息）

² WITH_OFFSETS ：保存term vectors。（保存值和Token的offset）WITH_POSITIONS_OFFSETS：保存term vectors。（保存值和token位置信息和Token的offset）