Lucence的Field属性整理

来源:互联网 发布:吃饭排队叫号软件 编辑:程序博客网 时间:2024/05/21 17:25
Field属性
1.存储选项
Field.Store.YES
表示会把这个域中的内容完全存储到索引文件中,方便进行域内容的还原
Field.Store.NO
表示这个域的内容不会存储到索引文件中,但是可以被索引,此时该域的内容无法完全还原

2.分词选项
Field.Index.ANALYZED:表示对域进行分词和索引,使用于标题,内容等域
Field.Index.NOT_ANALYZED:表示对域进行索引,但是不进行分词。适用于身份证号,ID,姓名,邮件等,可以精确搜索
Field.Index.ANALYZED_NOT_NORMS:表示对域进行分词,但是不存储norms信息。这个norms中包括了创建索引的时间和权值等信息
Field.Index.NOT_ANALYZED_NOT_NORMS:表示对域不进行分词,也不存储norms信息。适用于标示符(主键,文件名)
Field.Index.NO:表示对域不进行索引

3.最佳实践

分词选项                                             存储选项                                                场景
NOT_ANALYZED_NOT_NORMS         YES              标示符(主键,文件名),身份证号,电话号码,日期,姓名
ANALYZED                                          YES              标题,摘要,简介
 ANALYZED                                         NO              文档正文
NO                                                       YES              文档类型,数据库主键
NOT_ANALYZED                                 NO              隐藏的关键字





0 0
原创粉丝点击