Solr 文章集成

来源:互联网 发布:网络直销和网络间销 编辑:程序博客网 时间:2024/05/16 10:04

Solr 文章集成

  1. solr原理
    1. solr wiki: http://wiki.apache.org/solr/
    2. 分布式全文检索系统SolrCloud简介 http://my.oschina.net/004/blog/175768
    3. collection,shard,core,leader,replica
    4. solr组件图,http://www.solr.cc/blog/?attachment_id=106
    5. 索引组件,检索组件:solrconfig配置
    6. 流水线各组件,schema.xml配置
    7. 数据导入时,先更新到leader再同步到replica
    8. solr数据提交分为两种,软提交和硬提交,是否开启随时提交在solrconfig中配置
    9. solr机群的机器数量最好提前规划
  2. 构建索引分词
    1. Solr之中文分词。 http://blog.csdn.net/zhu_tianwei/article/details/46711511
    2. 在schema.xml中配,在相关wiki中很详细
    3. 配置同义词词典,停用词词典,扩展词词词典,查询&索引,停用词,同义词filter等。http://v.youku.com/v_show/id_XNTgwODU4MTgw.html?from=y1.7-2
  3. query分词。
    1. 分词叫做analyzer
    2. Solr 使用自定义 Query Parser
      http://blog.chenlb.com/2010/08/solr-use-custom-query-parser.html
  4. 查询参数。
    1. Solr查询详解http://www.cnblogs.com/johnwood/p/3449118.html
    2. Solr 使用自定义 Query Parser. http://www.jisu3d.com/2010/0526/22459.html
  5. 查询结果排序。 Ranked retrieval

    1. 完全匹配排在首位 http://chenzhenianqing.cn/articles/888.html
    2. Solrj 排序样例汇总。http://blog.sina.com.cn/s/blog_4d58e3c00101h5xc.html
    3. Solr搜索的排序打分规则探讨 http://elastos.org/redmine/boards/23/topics/348
    4. Solr设定不同字段的权重,根据相关度和业务字段综合排序搜索
      http://outofmemory.cn/java/solr/search-function-query-effect-result-order
    5. Solr In Action 笔记(2) 之评分机制(相似性计算) http://www.cnblogs.com/rcfeng/p/4067896.html
  6. 相关搜索,Spell-checking

    1. solr 百度相关搜索类似功能的实现 http://www.sxt.cn/u/2715/blog/4240
    2. Solr搜索配置关联词synonyms。 http://my.oschina.net/baowenke/blog/104019
    3. 小试 solr 的 spellcheck。 http://blog.chenlb.com/2009/02/try-solr-spellcheck.html
      8.solr3.4 高亮(highlight),拼写检查(spellCheck),匹配相似(moreLikeThis) 应用实践 http://bastengao.iteye.com/blog/1197651
    4. http://yingbin920.iteye.com/blog/1568769
  7. 结果高亮
    1. solr学习笔记四:了解solr查询语法。http://www.guoweiwei.com/archives/830,也是通过文件进行配置。
    2. 高亮及自动完成。http://wenku.baidu.com/link?url=13c4goagyCTBruYgYAmsoTmG-72D6dgr5bL20wDTyduZPtvyZaBCyTKkx9bZMFQtHZTYq5JieecTK6JNfVnxZ_Ri6YWMG85Nzs8A4vRD7Sa
  8. Faceting
  9. Autosuggest
  10. 结果统计Stats,url参数中,增加stats=true
  11. More Like This component,相似文档搜索。
  12. Debug component,debug模式开启,查看返回结果具体参数,&debugQuery=true。
  13. solr cloud
    1. solr在初始化一个collection的时候,可以设置好sharedNumber,Shard Splitting,在shared保存文档达到阈值,或接收到API的命令,可以split为多个。
    2. shared split:http://host:port/solr/admin/collections?collection=[your_collection_name]&shard=[shard_name]&action=SPLITSHARD
  14. Cache及冷启动
    1. Solr缓存 http://www.solr.cc/blog/?p=999
    2. Filter Cache http://www.solr.cc/blog/?p=239
    3. 改进Solr性能 http://blog.csdn.net/zhangshuliai/article/details/8022547
  15. SolrJ示例
    1. 数据入库方式优化:http://www.solr.cc/blog/?p=96
    2. SolrJ查询示例 http://www.solrtutorial.com/solrj-tutorial.html
    3. http://www.solr.cc/blog/?p=1296
  16. 使用solr的系统。
    1. 简单搜索系统组成总结
      http://www.wklken.me/posts/2014/06/09/search-system.html
    2. 使用 Apache Solr 实现更加灵巧的搜索,第 1 部分: 基本特性和 Solr 模式 http://www.ibm.com/developerworks/cn/java/j-solr1/
  17. 文档资料

    1. csdn pdf: http://www.csdn.net/tag/solr
    2. 优酷资料: http://i.youku.com/solrcn
  18. solr配置文件

    1. schema.xml: solr的实例,有多少字段,每个字段是什么类型,每个字段如何分词。
      http://wiki.apache.org/solr/SchemaXml

    2. solrconfig:索引的配置,缓存用多大,哪些地方用缓存,用哪些检索的分析器。
      http://wiki.apache.org/solr/SolrConfigXml

  19. 性能调优

    1. Solr 性能因素 http://www.solr.cc/blog/?p=58
    2. Solr调优参考 http://itindex.net/detail/40572-solr
    3. solr性能调优(taobaoer推荐)http://xiaoyezi1128.iteye.com/blog/560685
    4. Solr调优参考 http://www.blogjava.net/conans/articles/379550.html
    5. Solr调优参考(三篇)
      http://itindex.net/detail/37725-solr
    6. 如果一个分片的所有机器都宕机了,是会报异常的,如果不想报异常查询参数加上params.setParam(“shards.tolerant”, true)
    7. Solr优化官方文档,http://blog.csdn.net/babydavic/article/details/8701327
  20. jvm配置

    1. 参考solr in action第12章。要配置运行堆栈大小上下限以及垃圾回收参数。
  21. solr query日志挖掘
    1. 关于搜索挖掘所想 http://jm-blog.aliapp.com/?p=2110

.

1 1
原创粉丝点击