Solr4 + Jcseg(分词器) 安装配置--源自技术
来源:互联网 发布:淘宝天猫超市优惠券 编辑:程序博客网 时间:2024/06/01 08:06
环境部署
这里我安装的是Solr4.6和jcseg1.9.2
下载地址(网上可以搜索到)
安装solr:
1.solr安装解压后,将\solr-4.6.0\dist目录下的solr-4.6.0.war 更名为solr.war,然后放到tomcat的webapps下;
2.将\solr-4.6.0\example目录下的solr目录拷贝到tomcat子目录中;
3.在tomcat中conf\Catalina\localhost目录下添加solr.xml文件:
- <?xml version="1.0" encoding="UTF-8"?>
- <Context docBase="D:/solr/tomcat/webapps/solr" debug="0" crossContext="true" >
- <Environment name="solr/home" type="java.lang.String" value="D:/solr/tomcat/solr" override="true" />
- </Context>
启动Tomcat后,访问:http://localhost:8080/solr/
配置中文分词Jcseg:
1.修改\tomcat\solr\collection1\conf目录下的schema.xml文件,添加如下代码:
- <fieldtype name="textComplex" class="solr.TextField">
- <analyzer>
- <tokenizer class="org.lionsoul.jcseg.solr.JcsegTokenizerFactory" mode="complex"/>
- </analyzer>
- </fieldtype>
- <fieldtype name="textSimple" class="solr.TextField">
- <analyzer>
- <tokenizer class="org.lionsoul.jcseg.solr.JcsegTokenizerFactory" mode="simple"/>
- </analyzer>
- </fieldtype>
2.将jar包添加到tomcat/webapps/solr/WEB-INFO/lib目录中
这里添加的jar包包括:
jcseg目录中:jcseg-core-1.9.2.jar, jcseg-solr-1.9.2.jar
solr-4.6.0\dist\solrj-lib目录中:所有jar
3.将jcseg词库添加到tomcat/webapps/solr/WEB-INFO/lib目录中
将jcseg目录中lexicon目录拷贝
测试
打开http://localhost:8080/solr/#/collection1/analysis
输入搜索词:四川省发生了地震,选择fieldType,看结果
0 0
- Solr4 + Jcseg(分词器) 安装配置--源自技术
- Solr4 + Jcseg(数据导入) 安装配置--源自技术
- 中文分词器 jcseg
- solr4.8安装步骤和配置IK分词器
- solr4.7中文分词器(ik-analyzer)配置
- solr4.7中文分词器(ik-analyzer)配置
- solr4.7中文分词器(ik-analyzer)配置
- solr4.7中文分词器(ik-analyzer)配置
- solr4.7中文分词器(ik-analyzer)配置
- solr4.7中文分词器(ik-analyzer)配置
- 安装IKAnalyzer2012分词器(windows7+tomcat8.0+solr4.6)
- solr4.5 mmseg4j 分词器配置
- solr4.5配置中文分词器mmseg4j
- solr4.5配置ik分词器
- solr4.5配置中文分词器mmseg4j
- solr4.5配置中文分词器mmseg4j
- Solr4.2安装IK中文分词器
- jcseg分词
- mysql 使用 workbench工具【E-R图 <--> 数据库】之间相互转换
- Android蓝牙开发浅谈
- liunx 服务器时间和本地时间不匹配
- java基础学习总结——GUI编程(二)
- JAVA多线程——多线程的几种实现方法详解
- Solr4 + Jcseg(分词器) 安装配置--源自技术
- git基本命令
- HDUOJ-1026 Ignatius and the Princess I (时间优先队列+广搜)
- 淘宝技术发展
- 七个技巧大幅提高域名安全指数
- 用容器去遍历一个学生信息的结构体。
- ANDROID源码编译3 - 编译和运行
- 测试数据生成工具
- OC4