solr带carrot2插件可以用配置好的solrconfig.xml

来源：互联网发布：js 刷新界面编辑：程序博客网时间：2024/05/01 22:44

<?xml version="1.0" encoding="UTF-8" ?>



<config>



<luceneMatchVersion>4.8</luceneMatchVersion>




<lib dir="../../../contrib/extraction/lib" regex=".*\.jar" />
<lib dir="../../../dist/" regex="solr-cell-\d.*\.jar" />

<lib dir="../../../contrib/clustering/lib/" regex=".*\.jar" />
<lib dir="../../../dist/" regex="solr-clustering-\d.*\.jar" />

<lib dir="../../../contrib/langid/lib/" regex=".*\.jar" />
<lib dir="../../../dist/" regex="solr-langid-\d.*\.jar" />

<lib dir="../../../contrib/velocity/lib" regex=".*\.jar" />
<lib dir="../../../dist/" regex="solr-velocity-\d.*\.jar" />
<lib dir="../../../contrib/clustering/lib/" regex=".*\.jar" />
<lib dir="../../../dist/" regex=".*solr-clustering-.*\.jar" />





<dataDir>${solr.data.dir:}</dataDir>


<directoryFactory name="DirectoryFactory"
class="${solr.directoryFactory:solr.NRTCachingDirectoryFactory}">




<str name="solr.hdfs.home">${solr.hdfs.home:}</str>

<str name="solr.hdfs.confdir">${solr.hdfs.confdir:}</str>

<str name="solr.hdfs.blockcache.enabled">${solr.hdfs.blockcache.enabled:true}</str>

<str name="solr.hdfs.blockcache.global">${solr.hdfs.blockcache.global:true}</str>

</directoryFactory>


<codecFactory class="solr.SchemaCodecFactory"/>


<schemaFactory class="ClassicIndexSchemaFactory"/>


<indexConfig>
























<lockType>${solr.lock.type:native}</lockType>





















<infoStream>true</infoStream>
</indexConfig>


<jmx />






<updateHandler class="solr.DirectUpdateHandler2">


<updateLog>
<str name="dir">${solr.ulog.dir:}</str>
</updateLog>


<autoCommit>
<maxTime>${solr.autoCommit.maxTime:15000}</maxTime>
<openSearcher>false</openSearcher>
</autoCommit>



<autoSoftCommit>
<maxTime>${solr.autoSoftCommit.maxTime:-1}</maxTime>
</autoSoftCommit>






</updateHandler>







<query>

<maxBooleanClauses>1024</maxBooleanClauses>




<filterCache class="solr.FastLRUCache"
size="512"
initialSize="512"
autowarmCount="0"/>


<queryResultCache class="solr.LRUCache"
size="512"
initialSize="512"
autowarmCount="0"/>


<documentCache class="solr.LRUCache"
size="512"
initialSize="512"
autowarmCount="0"/>


<cache name="perSegFilter"
class="solr.search.LRUCache"
size="10"
initialSize="0"
autowarmCount="10"
regenerator="solr.NoOpRegenerator" />








<enableLazyFieldLoading>true</enableLazyFieldLoading>





<queryResultWindowSize>20</queryResultWindowSize>


<queryResultMaxDocsCached>200</queryResultMaxDocsCached>



<listener event="newSearcher" class="solr.QuerySenderListener">
<arr name="queries">

</arr>
</listener>
<listener event="firstSearcher" class="solr.QuerySenderListener">
<arr name="queries">
<lst>
<str name="q">static firstSearcher warming in solrconfig.xml</str>
</lst>
</arr>
</listener>


<useColdSearcher>false</useColdSearcher>


<maxWarmingSearchers>2</maxWarmingSearchers>

</query>


<requestDispatcher handleSelect="false" >

<requestParsers enableRemoteStreaming="true"
multipartUploadLimitInKB="2048000"
formdataUploadLimitInKB="2048"
addHttpRequestToContext="false"/>


<httpCaching never304="true" />




</requestDispatcher>



<requestHandler name="/select" class="solr.SearchHandler">

<lst name="defaults">
<str name="echoParams">explicit</str>
<int name="rows">10</int>
<str name="df">text</str>
</lst>







</requestHandler>


<requestHandler name="/query" class="solr.SearchHandler">
<lst name="defaults">
<str name="echoParams">explicit</str>
<str name="wt">json</str>
<str name="indent">true</str>
<str name="df">text</str>
</lst>
</requestHandler>
<requestHandler name="/config1_1" class="solr.SearchHandler">
<lst name="defaults">
<str name="defType">edismax</str>
<str name="qf">
title^1.5 content^1.0
</str>
<str name="rows">100</str>
<str name="fl">*,author</str>

<bool name="clustering">true</bool> 
<bool name="clustering.results">true</bool> 
<str name="clustering.engine">default</str> 

<str name="carrot.url">id</str> 
<str name="carrot.title">title</str> 
<str name="carrot.snippet">content</str> 
</lst>

<arr name="last-components">
<str>clustering</str>
</arr>
</requestHandler>
<requestHandler name="/config1_3" class="solr.SearchHandler">
<lst name="defaults">
<str name="defType">edismax</str>
<str name="qf">
title^1.5 content^1.0
</str>
<str name="rows">100</str>
<str name="fl">id,title,anchor</str>

<bool name="hl">true</bool>
<str name="hl.fl">content</str>

<str name="hl.simple.pre"></str>
<str name="hl.simple.post"></str>
<str name="f.content.hl.snippets">3</str> 
<str name="f.content.hl.fragsize">200</str>
<bool name="clustering">true</bool>
<bool name="clustering.results">true</bool>
<str name="clustering.engine">default</str>
<str name="carrot.url">id</str>
<str name="carrot.title">title</str>
<str name="carrot.snippet">content</str>
</lst>
<arr name="last-components">
<str>clustering</str>
</arr>
</requestHandler>
<requestHandler name="/config2_1" class="solr.SearchHandler">
<lst name="defaults">
<str name="defType">edismax</str>
<str name="qf">
title^1.5 content^1.0
</str>
<str name="rows">100</str>
<str name="fl">id,title,anchor</str>
<bool name="clustering">true</bool>
<bool name="clustering.results">true</bool>
<str name="clustering.engine">default</str>

<str name="carrot.url">id</str>
<str name="carrot.title">title</str>
<str name="carrot.snippet">content</str>

<str name="carrot.produceSummary">true</str>

<str name="carrot.summarySnippets">3</str>
</lst>
<arr name="last-components">
<str>clustering</str>
</arr>
</requestHandler>
<requestHandler name="/config2_2" class="solr.SearchHandler">
<lst name="defaults">
<str name="defType">edismax</str>
<str name="qf">
title^1.5 content^1.0
</str>
<str name="rows">100</str>
<str name="fl">id,title,anchor</str>

<bool name="hl">true</bool>
<str name="hl.fl">content</str>

<str name="hl.simple.pre"></str>
<str name="hl.simple.post"></str>
<str name="f.content.hl.snippets">3</str> 
<str name="f.content.hl.fragsize">200</str>
<bool name="clustering">true</bool>
<bool name="clustering.results">true</bool>
<str name="clustering.engine">default</str>

<str name="carrot.url">name</str>
<str name="carrot.title">title</str>
<str name="carrot.snippet">content</str>

<str name="carrot.produceSummary">true</str>

<str name="carrot.summarySnippets">3</str>
</lst>
<arr name="last-components">
<str>clustering</str>
</arr>
</requestHandler>

<requestHandler name="/get" class="solr.RealTimeGetHandler">
<lst name="defaults">
<str name="omitHeader">true</str>
<str name="wt">json</str>
<str name="indent">true</str>
</lst>
</requestHandler>


<requestHandler name="/browse" class="solr.SearchHandler">
<lst name="defaults">
<str name="echoParams">explicit</str>


<str name="wt">velocity</str>
<str name="v.template">browse</str>
<str name="v.layout">layout</str>
<str name="title">Solritas</str>


<str name="defType">edismax</str>
<str name="qf">
text^0.5 features^1.0 name^1.2 sku^1.5 id^10.0 manu^1.1 cat^1.4
title^10.0 description^5.0 keywords^5.0 author^2.0 resourcename^1.0
</str>
<str name="df">text</str>
<str name="mm">100%</str>
<str name="q.alt">*:*</str>
<str name="rows">10</str>
<str name="fl">*,score</str>

<str name="mlt.qf">
text^0.5 features^1.0 name^1.2 sku^1.5 id^10.0 manu^1.1 cat^1.4
title^10.0 description^5.0 keywords^5.0 author^2.0 resourcename^1.0
</str>
<str name="mlt.fl">text,features,name,sku,id,manu,cat,title,description,keywords,author,resourcename</str>
<int name="mlt.count">3</int>


<str name="facet">on</str>
<str name="facet.field">cat</str>
<str name="facet.field">manu_exact</str>
<str name="facet.field">content_type</str>
<str name="facet.field">author_s</str>
<str name="facet.query">ipod</str>
<str name="facet.query">GB</str>
<str name="facet.mincount">1</str>
<str name="facet.pivot">cat,inStock</str>
<str name="facet.range.other">after</str>
<str name="facet.range">price</str>
<int name="f.price.facet.range.start">0</int>
<int name="f.price.facet.range.end">600</int>
<int name="f.price.facet.range.gap">50</int>
<str name="facet.range">popularity</str>
<int name="f.popularity.facet.range.start">0</int>
<int name="f.popularity.facet.range.end">10</int>
<int name="f.popularity.facet.range.gap">3</int>
<str name="facet.range">manufacturedate_dt</str>
<str name="f.manufacturedate_dt.facet.range.start">NOW/YEAR-10YEARS</str>
<str name="f.manufacturedate_dt.facet.range.end">NOW</str>
<str name="f.manufacturedate_dt.facet.range.gap">+1YEAR</str>
<str name="f.manufacturedate_dt.facet.range.other">before</str>
<str name="f.manufacturedate_dt.facet.range.other">after</str>


<str name="hl">on</str>
<str name="hl.fl">content features title name</str>
<str name="hl.encoder">html</str>
<str name="hl.simple.pre"></str>
<str name="hl.simple.post"></str>
<str name="f.title.hl.fragsize">0</str>
<str name="f.title.hl.alternateField">title</str>
<str name="f.name.hl.fragsize">0</str>
<str name="f.name.hl.alternateField">name</str>
<str name="f.content.hl.snippets">3</str>
<str name="f.content.hl.fragsize">200</str>
<str name="f.content.hl.alternateField">content</str>
<str name="f.content.hl.maxAlternateFieldLength">750</str>


<str name="spellcheck">on</str>
<str name="spellcheck.extendedResults">false</str>
<str name="spellcheck.count">5</str>
<str name="spellcheck.alternativeTermCount">2</str>
<str name="spellcheck.maxResultsForSuggest">5</str>
<str name="spellcheck.collate">true</str>
<str name="spellcheck.collateExtendedResults">true</str>
<str name="spellcheck.maxCollationTries">5</str>
<str name="spellcheck.maxCollations">3</str>
</lst>


<arr name="last-components">
<str>spellcheck</str>
</arr>
</requestHandler>


<requestHandler name="/update" class="solr.UpdateRequestHandler">


</requestHandler>


<requestHandler name="/update/json" class="solr.UpdateRequestHandler">
<lst name="defaults">
<str name="stream.contentType">application/json</str>
</lst>
</requestHandler>
<requestHandler name="/update/csv" class="solr.UpdateRequestHandler">
<lst name="defaults">
<str name="stream.contentType">application/csv</str>
</lst>
</requestHandler>


<requestHandler name="/update/extract"
startup="lazy"
class="solr.extraction.ExtractingRequestHandler" >
<lst name="defaults">
<str name="lowernames">true</str>
<str name="uprefix">ignored_</str>


<str name="captureAttr">true</str>
<str name="fmap.a">links</str>
<str name="fmap.div">ignored_</str>
</lst>
</requestHandler>


<requestHandler name="/analysis/field"
startup="lazy"
class="solr.FieldAnalysisRequestHandler" />


<requestHandler name="/analysis/document"
class="solr.DocumentAnalysisRequestHandler"
startup="lazy" />


<requestHandler name="/admin/"
class="solr.admin.AdminHandlers" />






<requestHandler name="/admin/ping" class="solr.PingRequestHandler">
<lst name="invariants">
<str name="q">solrpingquery</str>
</lst>
<lst name="defaults">
<str name="echoParams">all</str>
</lst>


</requestHandler>


<requestHandler name="/debug/dump" class="solr.DumpRequestHandler" >
<lst name="defaults">
<str name="echoParams">explicit</str>
<str name="echoHandler">true</str>
</lst>
</requestHandler>


<requestHandler name="/replication" class="solr.ReplicationHandler" >



</requestHandler>




<searchComponent name="spellcheck" class="solr.SpellCheckComponent">

<str name="queryAnalyzerFieldType">text_general</str>




<lst name="spellchecker">
<str name="name">default</str>
<str name="field">text</str>
<str name="classname">solr.DirectSolrSpellChecker</str>

<str name="distanceMeasure">internal</str>

<float name="accuracy">0.5</float>

<int name="maxEdits">2</int>

<int name="minPrefix">1</int>

<int name="maxInspections">5</int>

<int name="minQueryLength">4</int>

<float name="maxQueryFrequency">0.01</float>

</lst>


<lst name="spellchecker">
<str name="name">wordbreak</str>
<str name="classname">solr.WordBreakSolrSpellChecker</str>
<str name="field">name</str>
<str name="combineWords">true</str>
<str name="breakWords">true</str>
<int name="maxChanges">10</int>
</lst>









</searchComponent>


<searchComponent name="clustering" enable="true" class="solr.clustering.ClusteringComponent" >

<lst name="engine">

<str name="name">default</str>

<str name="carrot.algorithm">org.carrot2.clustering.lingo.LingoClusteringAlgorithm</str>

<str name="LingoClusteringAlgorithm.desiredClusterCountBase">20</str>

<str name="carrot.lexicalResourcesDir">clustering/carrot2</str>

<str name="MultilingualClustering.defaultLanguage">ENGLISH</str>

</lst>

</searchComponent>

<requestHandler name="/spell" class="solr.SearchHandler" startup="lazy">
<lst name="defaults">
<str name="df">text</str>

<str name="spellcheck.dictionary">default</str>
<str name="spellcheck.dictionary">wordbreak</str>
<str name="spellcheck">on</str>
<str name="spellcheck.extendedResults">true</str>
<str name="spellcheck.count">10</str>
<str name="spellcheck.alternativeTermCount">5</str>
<str name="spellcheck.maxResultsForSuggest">5</str>
<str name="spellcheck.collate">true</str>
<str name="spellcheck.collateExtendedResults">true</str>
<str name="spellcheck.maxCollationTries">10</str>
<str name="spellcheck.maxCollations">5</str>
</lst>
<arr name="last-components">
<str>spellcheck</str>
</arr>
</requestHandler>

<searchComponent name="suggest" class="solr.SuggestComponent">
<lst name="suggester">
<str name="name">mySuggester</str>
<str name="lookupImpl">FuzzyLookupFactory</str> 
<str name="dictionaryImpl">DocumentDictionaryFactory</str> 
<str name="field">cat</str>
<str name="weightField">price</str>
<str name="suggestAnalyzerFieldType">string</str>
</lst>
</searchComponent>

<requestHandler name="/suggest" class="solr.SearchHandler" startup="lazy">
<lst name="defaults">
<str name="suggest">true</str>
<str name="suggest.count">10</str>
</lst>
<arr name="components">
<str>suggest</str>
</arr>
</requestHandler>

<searchComponent name="tvComponent" class="solr.TermVectorComponent"/>


<requestHandler name="/tvrh" class="solr.SearchHandler" startup="lazy">
<lst name="defaults">
<str name="df">text</str>
<bool name="tv">true</bool>
</lst>
<arr name="last-components">
<str>tvComponent</str>
</arr>
</requestHandler>


<searchComponent name="clustering"
enable="${solr.clustering.enabled:false}"
class="solr.clustering.ClusteringComponent" >
<lst name="engine">
<str name="name">lingo</str>


<str name="carrot.algorithm">org.carrot2.clustering.lingo.LingoClusteringAlgorithm</str>


<str name="carrot.resourcesDir">clustering/carrot2</str>
</lst>


<lst name="engine">
<str name="name">stc</str>
<str name="carrot.algorithm">org.carrot2.clustering.stc.STCClusteringAlgorithm</str>
</lst>


<lst name="engine">
<str name="name">kmeans</str>
<str name="carrot.algorithm">org.carrot2.clustering.kmeans.BisectingKMeansClusteringAlgorithm</str>
</lst>
</searchComponent>


<requestHandler name="/clustering"
startup="lazy"
enable="${solr.clustering.enabled:false}"
class="solr.SearchHandler">
<lst name="defaults">
<bool name="clustering">true</bool>
<bool name="clustering.results">true</bool>

<str name="carrot.title">name</str>

<str name="carrot.url">id</str>

<str name="carrot.snippet">features</str>

<bool name="carrot.produceSummary">true</bool>



<bool name="carrot.outputSubClusters">false</bool>


<str name="defType">edismax</str>
<str name="qf">
text^0.5 features^1.0 name^1.2 sku^1.5 id^10.0 manu^1.1 cat^1.4
</str>
<str name="q.alt">*:*</str>
<str name="rows">10</str>
<str name="fl">*,score</str>
</lst>
<arr name="last-components">
<str>clustering</str>
</arr>
</requestHandler>


<searchComponent name="terms" class="solr.TermsComponent"/>


<requestHandler name="/terms" class="solr.SearchHandler" startup="lazy">
<lst name="defaults">
<bool name="terms">true</bool>
<bool name="distrib">false</bool>
</lst>
<arr name="components">
<str>terms</str>
</arr>
</requestHandler>


<searchComponent name="elevator" class="solr.QueryElevationComponent" >

<str name="queryFieldType">string</str>
<str name="config-file">elevate.xml</str>
</searchComponent>


<requestHandler name="/elevate" class="solr.SearchHandler" startup="lazy">
<lst name="defaults">
<str name="echoParams">explicit</str>
<str name="df">text</str>
</lst>
<arr name="last-components">
<str>elevator</str>
</arr>
</requestHandler>


<searchComponent class="solr.HighlightComponent" name="highlight">
<highlighting>


<fragmenter name="gap"
default="true"
class="solr.highlight.GapFragmenter">
<lst name="defaults">
<int name="hl.fragsize">100</int>
</lst>
</fragmenter>


<fragmenter name="regex"
class="solr.highlight.RegexFragmenter">
<lst name="defaults">

<int name="hl.fragsize">70</int>

<float name="hl.regex.slop">0.5</float>

<str name="hl.regex.pattern">[-\w ,/\n\"']{20,200}</str>
</lst>
</fragmenter>


<formatter name="html"
default="true"
class="solr.highlight.HtmlFormatter">
<lst name="defaults">
<str name="hl.simple.pre"><![CDATA[]]></str>
<str name="hl.simple.post"><![CDATA[]]></str>
</lst>
</formatter>


<encoder name="html"
class="solr.highlight.HtmlEncoder" />


<fragListBuilder name="simple"
class="solr.highlight.SimpleFragListBuilder"/>


<fragListBuilder name="single"
class="solr.highlight.SingleFragListBuilder"/>


<fragListBuilder name="weighted"
default="true"
class="solr.highlight.WeightedFragListBuilder"/>


<fragmentsBuilder name="default"
default="true"
class="solr.highlight.ScoreOrderFragmentsBuilder">

</fragmentsBuilder>


<fragmentsBuilder name="colored"
class="solr.highlight.ScoreOrderFragmentsBuilder">
<lst name="defaults">
<str name="hl.tag.pre"><![CDATA[
,,
,,
,,
,,
,]]></str>
<str name="hl.tag.post"><![CDATA[]]></str>
</lst>
</fragmentsBuilder>

<boundaryScanner name="default"
default="true"
class="solr.highlight.SimpleBoundaryScanner">
<lst name="defaults">
<str name="hl.bs.maxScan">10</str>
<str name="hl.bs.chars">.,!? 	
</str>
</lst>
</boundaryScanner>

<boundaryScanner name="breakIterator"
class="solr.highlight.BreakIteratorBoundaryScanner">
<lst name="defaults">

<str name="hl.bs.type">WORD</str>


<str name="hl.bs.language">en</str>
<str name="hl.bs.country">US</str>
</lst>
</boundaryScanner>
</highlighting>
</searchComponent>















<queryResponseWriter name="json" class="solr.JSONResponseWriter">

<str name="content-type">text/plain; charset=UTF-8</str>
</queryResponseWriter>


<queryResponseWriter name="velocity" class="solr.VelocityResponseWriter" startup="lazy"/>



<queryResponseWriter name="xslt" class="solr.XSLTResponseWriter">
<int name="xsltCacheLifetimeSeconds">5</int>
</queryResponseWriter>















<admin>
<defaultQuery>*:*</defaultQuery>
</admin>

</config>

0 0