solr分词测试
来源:互联网 发布:java 多线程 set slep 编辑:程序博客网 时间:2024/06/05 01:13
原文:http://blog.csdn.net/u012385190/article/details/51682380
一、solr分词
这里使用的是mmseg4j 分词,该jar包网上下载的普遍有问题,不能正常使用。经测试,该版本可以,下载地址: http://download.csdn.net/detail/u012385190/9550326;
1、将文件里的jar包拷贝到Tomcat\webapps\solr\WEB-INF\lib下;
2、在 D:\testsolr\solr_home\solr\ 目录下新建一个 dic 文件夹 , 把 新下载的词库(data文件夹下)拷贝到 dic 目录下;
3、在 D:\testsolr\solr_home\solr\my_core\conf\schema.xml 文件的里添加如下:
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
这里不同的name选用不同的分词方式;
其中dicPath属性的值为第二步的地址,不要写错哦;
4、在 D:\testsolr\solr_home\solr\my_core\conf\schema.xml 文件里添加如下 :
- 1
- 2
5、开启服务如下进行分词测试,如下图分词:
如下图所示root字段是没有分词的结果:
在过程中出现如下错误,是因为字段重复,在schema.xml中将另一个content字段的配置注释掉即可(name同理)。
6、如此,分词ok
阅读全文
0 0
- solr分词测试
- Solr中配置IKAnalyzer分词器配置,测试分词效果
- solr分词
- solr中文分词
- solr+mmseg4j 中文分词
- solr中文分词(mmseg4j)
- Solr 中文分词器
- solr+mmseg4j 中文分词
- solr中文分词
- solr 自定义分词器
- solr自定义分词器
- solr+mmseg4j 中文分词
- solr分词器
- Solr 使用中文分词
- solr中文分词(mmseg4j)
- solr配置中文分词
- Solr之中文分词
- solr安装ansj_seg分词
- vue脚手架中自定义全局组件的方法
- WaitForSingleObject的详细用法
- vector<int>与vector<int>::iterator
- 图解SQL之left join、right join、inner join的区别
- Eclipse快捷键大全
- solr分词测试
- leetcode Sort a linked list in O(n log n) time using constant space complexity.
- LeetCode 85. Maximal Rectangle&221. Maximal Square--动态规划
- oracle日常操作
- windows 批处理 获取当前目录及子目录的所有文件路径
- python中namedtuple的用法
- PIM独立组播协议
- bzoj4337: BJOI2015 树的同构 树hash
- 程序员必备的600个英语词汇合集(1)