Solr6配置中文分词库 IKAnalyzer

来源:互联网 发布:ubuntu 安装python 编辑:程序博客网 时间:2024/06/04 18:49

摘要: Solr有诸多分词器,本文介绍Solr6与中文分词库IKAnalyzer的整合,在此之前,你需要有一个可以运行Solr的环境,参见Solr6.0与Jetty、Tomcat在Win环境下搭建/部署

准备环境

  • Solr6
  • IKAnalyzer分词器(ik-analyzer-solr6-6.0.jar)

要准备一个适合Solr6的ik-analyzer,需要动手做一些改动,我在这里大致描述了怎么修改源码

Solr6整合中文分词Ik-analyzer

  1. 确保已经装好了Solr6
  2. 下载支持Solr6的Ik-analyzer分词器(如ik-analyzer-solr6-6.0.jar)
  3. 在solr_home下新建文件夹lib,将这个jar文件复制进去。
    这里写图片描述
  4. 配置schema.xml:在solr_home/core0/conf下找到schema.xml.bak文件,将其重命名为schema.xml删除managed-schema。
    这里写图片描述
  5. 编辑schema.xml:添加field和 fieldType 到schema.xml文件。
<!-- IK Analyzer--><field name="ik_analyzer"  type="text_ik" indexed="true"  stored="true"  multiValued="false" /><fieldType name="text_ik" class="solr.TextField">          <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>  </fieldType>  

测试

启动Solr,如果控制台没有报错,那就大功告成了。点击Analysis,测试几个数据看看。这个浙江省杭州市已经能分析出来了。
这里写图片描述

1 0
原创粉丝点击