ElasticSearch5.X IK分词器使用
来源:互联网 发布:bootcamp 访问mac文件 编辑:程序博客网 时间:2024/05/25 23:57
IK分词器使用
首先确保IK插件安装成功(安装文档:http://blog.csdn.net/wwd0501/article/details/78258274),然后在创建mapping时,设置IK分词器,设置analyzer和search_analyzer;在java api搜索中将不用再关注IK分词器的事情,原有代码可以不做任何修改。例:
1.create a index
curl -XPUT http://localhost:9200/class
2.create a mapping
curl -XPOST http://localhost:9200/class/student/_mapping -d'
{
"student": {
"properties": {
"name": {
"type": "text",
"analyzer": "ik_max_word",
"search_analyzer": "ik_smart"
},
"age": {
"type": "long"
}
}
}
}'
3.index some docs
curl -XPOST http://localhost:9200/class/student/1 -d'{"name":"菠菜","age":"10"}'
curl -XPOST http://localhost:9200/class/student/2 -d'{"name":"芹菜","age":"65"}'
curl -XPOST http://localhost:9200/class/student/3 -d'{"name":"大萝卜 大菠菜","age":"89"}'
4.query
curl -XPOST http://localhost:9200/class/student/_search -d'{ "query" : { "match" : { "name" : "芹菜" } }}'Result
{
- "took": 3,
- "timed_out": false,
ik_max_word: 会将文本做最细粒度的拆分,比如会将“中华人民共和国国歌”拆分为“中华人民共和国,中华人民,中华,华人,人民共和国,人民,人,民,共和国,共和,和,国国,国歌”,会穷尽各种可能的组合;
ik_smart: 会做最粗粒度的拆分,比如会将“中华人民共和国国歌”拆分为“中华人民共和国,国歌”。
其中我们在做索引的时候,希望能将所有的句子切分的更详细,以便更好的搜索,所以ik_max_word更多的用在做索引的时候,但是在搜索的时候,对于用户所输入的query(查询)词,我们可能更希望得比较准确的结果,例如,我们搜索“无花果”的时候,更希望是作为一个词进行查询,而不是切分为"无",“花”,“果”三个词进行结果的召回,因此ik_smart更加常用语对于输入词的分析
阅读全文
0 0
- ElasticSearch5.X IK分词器使用
- Elasticsearch5.x安装IK分词器以及热词配置
- elasticsearch5.x集群搭建,ik分词器,head插件
- Elasticsearch5.5.1安装IK中文分词器
- elasticsearch5.4 ik分词器插件安装
- Elasticsearch5.6.0安装ik分词器
- ElasticSearch5.3安装IK分词器
- ElasticSearch5中文分词(IK)
- elasticsearch5.1+IK分词器+Java实现近义词功能
- ElasticSearch5.3安装IK分词器并验证
- ElasticSearch5.3安装IK分词器并验证
- IK分词器的使用
- Elasticsearch5.X 搜索引擎框架 安装配置及analysis-ik中文分词插件安装
- Elasticsearch5.x windows安装并集成IK、pinyin分词和head插件
- elasticsearch5 ik+拼音分词_java代码
- Elasticsearch5.4.0 IK分词插件安装详解
- Ealsticsearch 5.x IK分词器
- elasticsearch5.5.2手动创建索引并配置ik中文分词器
- linux下部署nodejs
- Java switch 对数字、字符、枚举、字符串类型的支持
- android kernel dtb快速更新
- virtualbox 网络设置
- SOA入门--新建简单的web service project
- ElasticSearch5.X IK分词器使用
- 移动互联网时代,小微企业仍需要官网
- Vue+Django REST framework 生鲜电商项目
- 关于Hibernate的QBC查询hibernate_Restrictions用法
- Jenkins配置git插件以及服务器安装git
- 数据结构与算法之一(三种简单排序)
- 湘潭大学-基于Dragonboard 410c教室资源管理与信息查询系统(三)
- linux下nginx的安装与配置
- 指定网段走指定网卡网关方法