Solr-6.5.1配置中文分词器smartcn
来源:互联网 发布:电脑microsoft windows 编辑:程序博客网 时间:2024/06/01 07:43
solr的同步发行包smartcn可进行中文切词,smartcn的分词准确率不错,但就是不能自己定义新的词库,不过smartcn是跟solr同步的,所以不需要额外的下载,只需在solr的例子中拷贝进去即可。
第一步:
找到如下目录,复制中文分词器jar到solr项目的WEB-INF/lib目录下:
第二步:
在自定义的core下配置schema(schema目录可查看之前的文章):
<types> ........ <!-- 配置中文分词器 --> <fieldType name="text_smartcn" class="solr.TextField" positionIncrementGap="100"> <analyzer type="index"> <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/> </analyzer> <analyzer type="query"> <tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/> </analyzer> </fieldType></types>
第三步:
将需要中文分词的字段类型替换成上述类型:
<field name="goodsName" type="text_smartcn" indexed="true" stored="true" required="true" multiValued="false" />
阅读全文
0 0
- Solr-6.5.1配置中文分词器smartcn
- Solr 配置中文分词smartcn
- solr4.9之配置中文分词smartcn
- solr4.9之配置中文分词smartcn
- solr 6.4.1配置中文分词器
- solr配置中文分词器
- solr 中文分词器配置
- solr配置中文分词器
- Solr配置中文分词器
- solr配置中文分词
- solr-中文分词配置
- solr 配置中文分词
- solr安装和配置中文分词器
- Solr配置中文分词器mmseg4j详解
- solr配置中文分词器IK Analyzer
- Solr配置中文分词器mmseg4j详解
- solr配置中文解析(分词)器
- 给solr配置中文分词器
- 反射-通过反射写一个通用的设置某个对象的某个属性为指定的值
- 【Linux】I/O多路转接poll
- react---react创建组件的三种方式以及区别:无状态组件、工厂模式、es6语法定义
- android高级控件-下拉刷新
- 石子合并
- Solr-6.5.1配置中文分词器smartcn
- Java:发送163邮件
- Amber16和AmberTools16在CentOS 7下GPU加速版的安装
- 淘淘商城系列——商品详情页面展示添加缓存
- ajax 不会执行返回数据中的js代码
- MySQL优化学习总结
- 一、构建maven父项目(多模块项目)
- 弹性盒子
- 换肤框架的资源