Elasticsearch2.3.4 配置同义词和中文分词

来源:互联网 发布:颜色矩阵 1.0f 编辑:程序博客网 时间:2024/06/06 02:22

1安装Elasticsearch2.3.4

elasticsearch安装的前提是jdk,elasticsearch5.x后需要jdk8来支持,本文安装的是es2.3.4版本故用jdk7。

下载es2.3.4

wget https://download.elastic.co/elasticsearch/release/org/elasticsearch/distribution/tar/elasticsearch/2.3.4/elasticsearch-2.3.4.tar.gz

解压es2.3.4

cd /usr/local/redis
tar -zxvf elasticsearch-2.3.4.tar.gz

配置elasticsearch

修改配置文件:vim $ES_HOME/config/elasticsearch.yml

cluster.name: zzht-es-clusternode.name: es-node-1network.host: xxx.xxx.xx.xxxhttp.port: 9200discovery.zen.ping.unicast.hosts: ["xxx.xxx.xx.xxx"]

同义词索引配置

index:    analysis:      analyzer:        ik_syno:            type: custom            tokenizer: ik_max_word            filter: [my_synonym_filter]        ik_syno_smart:            type: custom            tokenizer: ik_smart            filter: [my_synonym_filter]      filter:        my_synonym_filter:            type: synonym            synonyms_path: analysis/synonym.txt

配置elasticsearch集群

复制elasticsearch-node-1:
cp -rf /elasticsearch-cluster/elasticsearch-node-1 elasticsearch-node-2
修改配置(只需要修改节点名称和端口):

node.name: es-node-2http.port: 9201

修改完成后分别启动即可:
/elasticsearch-cluster/elasticsearch-node-1/bin/elasticsearch -d
/elasticsearch-cluster/elasticsearch-node-2/bin/elasticsearch -d

2.安装elasticsearch-analysis-ik

根据版本对应关系ik-1.9.4 和es2.3.4匹配(注意哦!)
https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v1.9.4/elasticsearch-analysis-ik-1.9.4.zip

将elasticsearch-analysis-ik-1.9.4.zip解压到$ES_HOME/plugins/ik文件夹中。

修改配置 vim $ES_HOME/plugins/ik/config/IKAnalyzer.cfg.xml

<?xml version="1.0" encoding="UTF-8"?><!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd"><properties>    <comment>IK Analyzer 扩展配置</comment>    <!--用户可以在这里配置自己的扩展字典 -->    <!--<entry key="ext_dict">custom/mydict.dic;custom/single_word_low_freq.dic</entry> -->    <!--用户可以在这里配置自己的扩展停止词字典-->    <!--<entry key="ext_stopwords">custom/ext_stopword.dic</entry> -->    <!--用户可以在这里配置远程扩展字典 -->    <entry key="remote_ext_dict">http://service.xxx.com/download/custom_main.dic</entry>    <!--用户可以在这里配置远程扩展停止词字典-->    <entry key="remote_ext_stopwords">http://service.xxx.com/download/ext_stopword.dic</entry></properties>

3.同义词注意事项

  • 同义词字典或是IK用户自定义词典更新,必须每次重启elasticsearch才有效。
  • 同义词词对是必须能被完成切分的词语。比如在synonyms.txt 文件中增加同义词对: ‘超级土豆’ – ‘土豆’ 。但在实际的搜索中用“超级土豆”是搜不到“土豆”的。因为“超级土豆”会被切分为多个词语。必须在http://service.xxx.com/download/custom_main.dic词典中新加“超级土豆”一词,才能用“超级土豆”一词搜出“土豆”。

4.创建索引和映射

curl -XPUT http://xxx:9200/goods

curl -XPOST http://xxx:9200/goods/goods_info/_mapping

{  "goods_info": {    "_all": {        "enabled": true,        "analyzer": "ik_max_word",        "search_analyzer": "ik_max_word",        "term_vector": "no",        "store": "false"    },    "properties": {      "goodsId": {        "type": "long"      },      "createTime": {        "type": "long"      },      "price": {        "type": "double"      },      "refPrice": {        "type": "double"      },      "details": {        "type": "string"      },      "inventory": {        "type": "long"      },      "userId": {        "type": "long"      },      "name": {        "type": "string",        "store": "no",        "term_vector": "with_positions_offsets",        "analyzer": "ik_syno",        "search_analyzer": "ik_syno",        "include_in_all": "true",        "boost": 8      },      "shelfTime": {        "type": "long"      },      "goodsImage": {        "type": "string"      },      "goodSizes": {        "type": "string"      }    }  }}

5.测试

在synonyms.txt 文件中增加
爱他美,爱她美,爱它美
并且需要将“爱她美“和”爱它美”放到custom_main.dic并发布大nginx,
请求:
http://xxx:9200/goods/_analyze?analyzer=ik_syno_smart&pretty=true&text=爱它美
查看同义词是否起作用。

0 0
原创粉丝点击
热门问题 老师的惩罚 人脸识别 我在镇武司摸鱼那些年 重生之率土为王 我在大康的咸鱼生活 盘龙之生命进化 天生仙种 凡人之先天五行 春回大明朝 姑娘不必设防,我是瞎子 大树被高锰酸钾灌溉了怎么办会死吗 防盗门门被锁了怎么办 门被里面反锁了怎么办 门里面被锁了怎么办 被锁在门里怎么办 门锁住了没钥匙怎么办 车被别人锁住了怎么办 汽车轱辘被锁了怎么办 小车轮胎被锁了怎么办 国防光缆无明显标识被挖断怎么办 临工210挖掘机柴油进气怎么办 汽车抛光蜡干了怎么办 洗碗铁丝球吃了怎么办 牙套铁丝吃肚子怎么办 小铁丝吃到肚子怎么办 绿色抛光膏干了怎么办 不锈钢被盐酸弄黑了怎么办 不锈钢被草酸洗了怎么办 不锈钢洗菜盆被草酸腐蚀了怎么办 汽油发电机加了柴油怎么办 装载机发动机加入齿轮油怎么办 印尼的FromE错了怎么办 寄快递被弄坏了怎么办 福田口岸手表被扣怎么办? 网页显示与服务器连接失败怎么办 唯品会中发货无法清关怎么办 国际快递被海关扣了怎么办 我想开一家物流公司手续怎么办? 物流公司把我的货弄丢了怎么办 物流公司压司机工资怎么办 立元增压泵不出水怎么办 高浊度pac不沉怎么办 集水池中沉积大量污泥怎么办 电脑qq截图不好使怎么办 捡了个手机需要指纹怎么办 手机锁屏锁住了怎么办 三星屏锁忘记了怎么办 文字下面有蓝色直线怎么办 苹果x不能截屏了怎么办 u盘在电脑上打不开怎么办 电脑桌面上文档剪切了怎么办