(三)solr的dataimport的配置以及中文分词
来源:互联网 发布:网络主播大揭秘工资 编辑:程序博客网 时间:2024/04/30 04:41
1、先来个建表文件products.sql(mysql)链接:http://pan.baidu.com/s/1o8wGwuI 密码:wm8s
2、在solr_home\solr\firstCore\conf下的solrconfig.xml中新增标签
<!-- 添加dataimporthandler标签 --> <lib dir="${solr.install.dir:../../../..}/contrib/dataimporthandler/lib" regex=".*\.jar" /> <!-- 添加mysql驱动标签 --> <lib dir="${solr.install.dir:../../../..}/contrib/db/lib" regex=".*\.jar" />
3、把solr-5.0.0\dist下的solr-dataimporthandler-5.0.0.jar拷贝进solr_home\contrib\dataimporthandler\lib下
把mysql-connector-java-5.1.12-bin.jar(可从上面网盘里下载获取官网下载)拷贝到solr_home\contrib\db\lib下
4、在solr_home\solr\firstCore\conf下的schema.xml中添加域字段
<!-- 商品名称 --> <field name="product_name" type="string" indexed="true" stored="true" /> <!-- 商品分类ID --> <field name="product_catalog" type="string" indexed="true" stored="true"/> <!-- 商品分类名称 --> <field name="product_catalog_name" type="string" indexed="true" stored="false"/> <!-- 商品价格 --> <field name="product_price" type="float" indexed="true" stored="true"/> <!-- 商品描述 --> <field name="product_description" type="string" indexed="true" stored="false"/> <!-- 商品图片地址 --> <field name="product_picture" type="string" indexed="true" stored="true"/> <!-- 目标域 --> <field name="product_keywords" type="string" indexed="true" stored="true" multiValued="true"/> <!-- 将商品名称添加到目标域 --> <copyField source="product_name" dest="product_keywords" /> <!-- 将商品描述添加到目标域 --> <copyField source="product_description" dest="product_keywords" />
在稍后的中文分词中,我们会把product_name、product_description的type更改为我们自定义的中文分词器的fieldType。
5、在solr_home\solr\firstCore\conf下的solrconfig.xml中新增dataimport的requestHandler
<!-- 配置dataimport的requestHandler --> <requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler"> <lst name="defaults"> <str name="config">data-config.xml</str> </lst> </requestHandler>
6、在solr_home\solr\firstCore\conf下新增文件data-config.xml
<?xml version="1.0" encoding="UTF-8"?><dataConfig> <dataSource type="JdbcDataSource" driver="com.mysql.jdbc.Driver" url="jdbc:mysql://localhost:3306/suimi" user="root" password="qbz" /><!-- 上面的数据库名称和用户名密码根据自己的实际来填写 --> <document> <entity name="product" query="SELECT pid,name,catalog_name,catalog,price,description,picture FROM products"> <field column="pid" name="id"/> <field column="name" name="product_name"/> <field column="catalog_name" name="product_catalog_name"/> <field column="catalog" name="product_catalog"/> <field column="price" name="product_price"/> <field column="description" name="product_description"/> <field column="picture" name="product_picture"/> <!-- field中的column的值必须与数据库中的字段一致;name必须是schema.xml中存在的field字段(除了主键ID外,其他的都是我们刚才创建的) --> </entity> </document></dataConfig>
7、启动tomcat,输入网址http://localhost:8080/solr
可以在Analysis中看到自定义的field
进而执行Dataimport动作
8、全部导入后,点击Query,然后执行查询可查到数据库表中的所有记录
9、此时我们在q中输入 product_name:小黄人 是搜不到任何东西的
因为我们没有分词,接下来配置中文分词
在solr_home\solr\firstCore\conf下的schema.xml中添加
<!-- 配置中文分词的FieldType --> <fieldType name="text_ik" class="solr.TextField" > <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"></analyzer> </fieldType> <!-- 配置中文分词的Field --> <field name="content_ik" type="text_ik" indexed="true" stored="true"/>
并更改
<!-- 商品名称 --> <field name="product_name" type="text_ik" indexed="true" stored="true" /> <!-- 商品描述 --> <field name="product_description" type="text_ik" indexed="true" stored="false"/> <!-- 目标域 --> <field name="product_keywords" type="text_ik" indexed="true" stored="true" multiValued="true"/>
将ik-analyzer-solr5-5.x.jar拷贝到:apache-tomcat-8.5.8\webapps\solr\WEB-INF\lib
在apache-tomcat-7.0.73\webapps\solr\WEB-INF\classes下新建文件IKAnalyzer.cfg.xml
<?xml version="1.0" encoding="UTF-8"?><!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd"> <properties> <comment>IK Analyzer 扩展配置</comment> <!--用户可以在这里配置自己的扩展停止词字典--> <entry key="ext_stopwords">stopword.dic;</entry> <!--用户可以在这里配置自己的扩展字典 ,多个词典用分号隔开 <entry key="ext_dict">mydict.dic;</entry> --> <entry key="ext_dict">moren.dic;qubianzhong.dic;</entry> </properties>
并可以在apache-tomcat-7.0.73\webapps\solr\WEB-INF\classes下新建自己的扩展词典
Q:未完待续(表述的还有些问题)
0 0
- (三)solr的dataimport的配置以及中文分词
- solr dataimport 的配置
- solr dataimport 的配置
- Solr集群搭建,zookeeper集群搭建,Solr分片管理,Solr集群下的DataImport,分词配置。
- Solr集群搭建,zookeeper集群搭建,Solr分片管理,Solr集群下的DataImport,分词配置。
- Solr配置,schema.xml的配置,以及中文分词
- Solr配置,schema.xml的配置,以及中文分词
- solr配置中文分词遇到的问题
- solr的IKAnalyzer中文分词器配置
- solr 中文分词器IK分词器的配置
- 三、为solr配置mmseg4j中文分词
- solr cloud 在集群中的配置,以及与中文分词, tomcat等等的整合(1)
- solr 的安装与使用、中文分词器的配置
- solr配置中文分词
- solr-中文分词配置
- solr 配置中文分词
- SOLR配置dataimport
- solr配置dataimport步骤
- C# 003 C#调用cmd.exe执行命令
- 使用Dnsmasq搭建本地dns服务器上网
- smartscreen筛选器阻止了这个不安全的下载
- gdb 调试高级命令
- 总结
- (三)solr的dataimport的配置以及中文分词
- 关于大三学生的请教回复
- 作为团队管理者,我是如何与团队成员分享信息的
- iOS 最详细的解析(数组与指针)笔试题
- 心路:PHP(序)
- 台式机通过笔记本的WIFI上网
- sql server 函数根据分隔符号拆分字符
- 润乾集算报表应用开发之页面嵌入
- python教程