solr 4.0 启用 自动聚类组件 carrot 的方法

来源:互联网 发布:ae cc软件下载mac 编辑:程序博客网 时间:2024/05/21 06:20
1 在solr配置上加入
solrconfig.xml
<requestHandler name="/clustering" class="solr.SearchHandler" default="true" >
  <lst name="defaults">
    <str name="echoParams">explicit</str>


    <bool name="clustering">true</bool>
    <str name="clustering.engine">default</str>
    <bool name="clustering.results">true</bool>


    <!-- Fields to cluster on -->
    <str name="carrot.title">name</str>
    <str name="carrot.snippet">features</str>
  </lst>
  <arr name="last-components">
    <str>clustering</str>
  </arr>
</requestHandler>




<searchComponent class="org.apache.solr.handler.clustering.ClusteringComponent" name="clustering" enable="${solr.clustering.enabled:true}>
  <lst name="engine">
    <str name="name">default</str>
    <str name="carrot.algorithm">org.carrot2.clustering.lingo.LingoClusteringAlgorithm</str>


    <!-- Engine-specific parameters -->
    <str name="LingoClusteringAlgorithm.desiredClusterCountBase">20</str>
  </lst>

</searchComponent>





3,拷贝 carrot2 的相关的包在源码的 solr-4.4.0\contrib\clustering\lib,到webapps的lib中,重启tomcat即可


在加入扩展包时,遇到一个问题,就是下载的solr项目下solr-4.4.0\contrib\clustering\lib的目录下没有jar包,这个需要运行contrib/clustering目录下的 build.xml

所以先安装Ant,然后运行 cmd,进入doc界面,进入contrib/clustering目录,运行 ant命令

便会下载相应的jar 包


如果想要 carrot2支持中文和自己的分词器,请参考 


原创粉丝点击