Elasticsearch替换中文分词

来源:互联网 发布:淘宝lol半价点券关键词 编辑:程序博客网 时间:2024/05/20 21:43

Elasticsearch的中文分词很烂,所以用ik替换。首先从github上下载项目,地址是:https://github.com/medcl/elasticsearch-analysis-ik

(1)使用unzip解压

unzip elasticsearch-analysis-ik-master.zip

如果提示找不到unzip,使用yum安装就行了。

(2)编译jar包

使用maven打包,如果没安装的话用yum安装

yum install maven

打包的命令:

cd elasticsearch-analysis-ik-mastermvn package

等待打包过程,期间还要从网上下载依赖,waiting…

(3)配置

copy and unzip target/releases/elasticsearch-analysis-ik-{version}.zip to your-es-root/plugins/ik

ik_max_word: 会将文本做最细粒度的拆分,比如会将“中华人民共和国国歌”拆分为“中华人民共和国,中华人民,中华,华人,人民共和国,人民,人,民,共和国,共和,和,国国,国歌”,会穷尽各种可能的组合;

ik_smart: 会做最粗粒度的拆分,比如会将“中华人民共和国国歌”拆分为“中华人民共和国,国歌”。

重启service elasticsearch restart,搞定。

0 0
原创粉丝点击