Solr2---域的类型和分类以及中文分词
来源:互联网 发布:nginx 市场占有量 编辑:程序博客网 时间:2024/04/30 02:29
一,域的类型和分类
C:\solrhome\collection2\conf\schema.xml
二,配置中文分词
1,拷贝IKAnalyzer2012FF_u1.jar到apache-tomcat-7.0.81\webapps\solr\WEB-INF\lib目录下面
2,拷贝配置文件ext.dic,IKAnalyzer.cfg.xml,stopword.dic到apache-tomcat-7.0.81\webapps\solr\WEB-INF\classes目录下面(如果没有classes目录需要手动创建)
3,修改solrhome\collection1\conf\schema.xml配置文件:
<fieldType name="text_ik" class="solr.TextField"> <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/> <analyzer type="query" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/> </fieldType> <field name="title_ik" type="text_ik" indexed="true" stored="true"/> <field name="content_ik" type="text_ik" indexed="true" stored="true"/>
4,重启tomcat服务器
三,导入数据库数据
1,将solr-4.10.3\dist下相关的jar包以及jdbc包拷贝到solrhome\collection1\lib目录下面
2:配置solrconfig.mxl文件,添加一个requestHandler。
<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler"> <lst name="defaults"> <str name="config">data-config.xml</str> </lst></requestHandler>
3,创建一个data-config.xml,保存到collection1\conf\目录下
<?xml version="1.0" encoding="UTF-8" ?> <dataConfig> <dataSource type="JdbcDataSource" driver="com.mysql.jdbc.Driver" url="jdbc:mysql://localhost:3306/lucene" user="root" password="root"/> <document> <entity name="product" query="SELECT pid,name,catalog_name,price,description,picture FROM products "> <field column="pid" name="id"/> <field column="name" name="product_name"/> <field column="catalog_name" name="product_catalog_name"/> <field column="price" name="product_price"/> <field column="description" name="product_description"/> <field column="picture" name="product_picture"/> </entity> </document> </dataConfig>
4,重启tomcat,点击“execute”按钮导入数据
到入数据前会先清空索引库,然后再导入。
四,浏览器操作
4.1. 删除文档
1) 删除制定ID的索引
<delete> <id>8</id></delete>
2) 删除查询到的索引数据
<delete> <query>product_catalog_name:幽默杂货</query></delete>
3) 删除所有索引数据
<delete> <query>*:*</query></delete>
4.2. 查询索引
通过/select搜索索引,Solr制定一些参数完成不同需求的搜索:
- q - 查询字符串,必须的,如果查询所有使用:。
fq - (filter query)过虑查询,作用:在q查询符合结果中同时是fq查询符合的,例如::
过滤查询价格从1到20的记录。
也可以在“q”查询条件中使用product_price:[1 TO 20],如下:
也可以使用“*”表示无限,例如:
20以上:product_price:[20 TO *]
20以下:product_price:[* TO 20]sort - 排序,格式:
sort=<field name>+<desc|asc>[,<field name>+<desc|asc>]
示例:
按价格降序
- Solr2---域的类型和分类以及中文分词
- 中文分词的分类
- 数据库分词查询的优缺点以及英文和中文各自的分词方法(一)
- 数据库分词查询的优缺点以及英文和中文各自的分词方法(二)
- 什么是中文分词以及中文分词的应用简介
- 中文分词的基本原理以及jieba分词的用法
- MMSEG介绍及基于分类的中文分词算法遐想
- Solr 关于Analyzer、Tokenizer、和Filter,以及中文分词器
- 关于中文分词的统计和规则
- IK 中文分词的配置和使用
- 中文自动分词歧义类型
- (三)solr的dataimport的配置以及中文分词
- Solr配置,schema.xml的配置,以及中文分词
- Lucene中文分词以及关键字的高亮
- Solr配置,schema.xml的配置,以及中文分词
- Rwordseg包安装过程以及简单的中文分词
- 中文分词和搜索引擎
- 中文分词和搜索引擎
- js常用的字符串方法分析
- Poj 2823 Sliding Window【单调队列学习】模板记录
- Unity Shader-渲染队列,ZTest,ZWrite,Early-Z
- 【Redis缓存机制】7.SortSet排序集合类型操作
- 构造方法基本理解
- Solr2---域的类型和分类以及中文分词
- 4976: 宝石镶嵌
- Android设置透明状态栏
- 引用类型实参和非引用类型实参对于字符串可能存在的问题
- python通过get,post方式发送http请求和接收http响应的方法
- ELK日志系统:Filebeat使用及Kibana如何设置登录认证
- 【Redis缓存机制】8.Hash集合类型操作使用
- LeetCode 565. Array Nesting
- 如何判断 Java 线程并发的安全性