solr-1 schemal.xml

来源:互联网 发布:单片机频率计 编辑:程序博客网 时间:2024/06/15 00:47

fieldtype

name:
class:
positionIncrementGap:只针对于 multivalued fields类型的字段有效.对于 multivalued fields类型的字段,指定两个 multiple values间的距离.具体见http://blog.csdn.net/asdfsadfasdfsa/article/details/74557830
autoGeneratePhraseQueries:只针对于text field有效,只在查询时有效,对索引时的分词无效.如果设置为true则solr讲自动生成phrase queries对于相互靠近的terms,如果设置为false,terms将必须以双引号引用才被视为phrase.默认为false
,即双引号指示了**其引用内容强制不分词http://blog.csdn.net/asdfsadfasdfsa/article/details/73850377
omitNorms:此属性若设置为true,即表示将忽略域值的长度标准化,忽略在索引过程中对当前域的权重设置,且会节省内存。只有全文本域或者你需要在索引创建过程中设置域的权重时才需要把这个值设为false,对于基本数据类型且不分词的域如intFeild,longField,StrField等默认此属性值就是true,否则默认就是false. norms的值是一个在建索引分词过程中根据相关分词属性计算的一个评分
termVectors: 使用morelikethis功能时开启, 但是不强制。如果该field设置为stored,则可以不开启(开启会有更好的搜索结果),如果stored关闭,则字段必须设置为true
termPositions:使用highlight功能时开启此选项和termvector选项
termOffsets:?
termPayloads:?
以上四个这些选项决定Solr是否保存每个文档的词向量(term vector),可以选择性的包含位置信息、每个词在向量中的偏移距离。可以加快高亮和其他辅助功能的执行速度,但会比较大的影响索引文件的大小。一般情况下这些信息并不是必要的。后三个是对termVectors的修饰,与omitTermFreqAndPositions众忽略的payload,positions是不同的 ,,,前者是正排索引, 后者是倒排索引,具体区分见http://blog.csdn.net/asdfsadfasdfsa/article/details/77652182
http://blog.csdn.net/asdfsadfasdfsa/article/details/77652177

indexed: true即表示需要对该域进行索引,一般如果你需要在该域上进行查询或排序时,则需要配置为true,默认值为false
stored: 表示是否需要把域值存储到硬盘上,方便你后续查询时能再次提取出来原样显示给用户
multiValued: 表示这个域是否可以存储多个值,若设置为true,即表示这是一个多值域
docValues:http://blog.csdn.net/asdfsadfasdfsa/article/details/71576750
sortMissingLast:表示如果域值为null,在根据当前域进行排序时,把包含null值的document排在最后一位
omitTermFreqAndPositions:对于text field外,其他的field都默认为true. 作用是用来设置是否忽略term的tf,payload,positions等权重信息
omitPositions:只忽略positions信息

uniqueKey

用来配置document的唯一标识域,即solr是用此域来决定增量导入时是否重复导入,如果id一样,则不会重复导入,或者当你更新索引时,你可以根据指定的uniqueKey域,来确定一个document,然后对该document进行更新。总之,它是用来唯一确定一个document的,跟数据库表里的主键id概念类似,前提是你uniqueKey里配置的域名称你需要提前使用field元素进行定义

defaultSearchField

默认搜索的字段,solrconfig中的配置会覆盖该配置

copyField

lucene中不存在,solr独有

dynamicField

lucene中不存在,solr独有

field

有两个默认field,分别是version和root,作用?
field下自有的属性为name,type,default(当该字段值不存在时可以指定默认存储的值). 除此之外该标签下可以选用field type下的属性来自定义,该定义会覆盖fieldtype下的定义

similarity

指定相似度算法,如没有指定默认使用DefaultSimilarity

这里写图片描述

docValues和termVectors的区别
二者都是正向索引
termVectors存的是该field下的term(词)和term的位置信息, 用于highlight和morelikethis功能实现
docValues存的是该field下的完整信息, 用于faceting和sort on filed功能实现