solr5 从Mysql查询数据

来源:互联网 发布:数据加密技术原理 编辑:程序博客网 时间:2024/06/16 20:02

版本:solr5.5 ,mysql5.6 
启动环境:solr自带的jetty服务器 
solr环境搭建和添加core: solr入门-环境搭建(http://blog.csdn.net/u014611990/article/details/73881612)

  • 因为需要连接mysql,所以自然少不了mysql连接驱动。还有因为在使用solr界面查询mysql数据时,

    需要先把数据载入到solr,建立索引后,才能查询数据,所以需要使用到solr的dataimport功能。

    准备mysql-connector-java-5.1.41.jarsolr-dataimporthandler-5.5.0.jar。 
    solr-dataimporthandler-5.5.0.jar可以从solr-5.5.0\dist目录下找到, 
    将两个包添加到solr-5.5.0\server\solr-webapp\webapp\WEB-INF\lib目录下,如果是将solr部署在tomcat下面,则是对应tomcat的webapp目录。

  • 编辑core下面的solrconfig.xml添加如下内容

     <requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">                 <lst name="defaults">                      <str name="config">solr-data-config.xml</str>                 </lst>       </requestHandler>  
  • 1
  • 2
  • 3
  • 4
  • 5

可以看到我们有引用solr-data-config.xml这个配置文件, 这个配置文件也可以在 
solr-5.5.0\example\example-DIH\solr\solr\conf中找到, 将其复制到自己core下面的conf文件下面,因为solrconifg.xml配置文件使用的是相对路径,也可以改成绝对路径,放置别处。

  • 编辑solr-data-config.xml,最终内容如下
<dataConfig>     <dataSource name="springbootdb" type="JdbcDataSource" driver="com.mysql.jdbc.Driver"   url="jdbc:mysql://127.0.0.1:3306/springbootdb?useUnicode=true&amp;characterEncoding=utf-8" user="root" password="root"/>      <document>    <entity name="user" dataSource="springbootdb" query="select * from user" >            <field column="id" name="id"/>            <field column="user_name" name="userName"/>            <field column="description" name="description"/>     </entity>  </document></dataConfig>
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10

url中的& 需要换成&amp, 否则后续导入

Data Config problem: 对实体 "useUnicode" 的引用必须以 ';' 分隔符结尾。

password属性要特别注意,密码最好不要带特殊符号比如”\ /” ,否则导入的时候报错, 被坑了好久, 才排查出来的。

Data Config problem: 对实体 "Q0usBfg" 的引用必须以 ';' 分隔符结尾
  • 1

entity跟hiberante的mapping映射类似, column数据库的列名, name映射的字段名

编辑managed-schema , 新版本是这个, 没后缀, 以前的版本是schema.xml , 自己也可以改成schema.xml , 将我们solr-data-config.xml entity中的字段添加到里面

  <field name="id" type="int" indexed="true" stored="true" required="true" multiValued="false" />      <field name="userName" type="string" indexed="true" stored="true"/>          <field name="description" type="string" indexed="true" stored="true"/>
  • 1
  • 2
  • 3

我表中的id字段是int型的, 所以我把自带的id字段改成了String类型,type字段类型,indexed是否索引,stored是否存储,multiValued是否分词

  • 启动solr

    这里写图片描述

注意的是这里的command参数,它有两个选项 
full-import:全量导入,它会覆盖原有的索引 
delta-import:即增量导入,它会在原有索引的基础上追加 
下面的几个多选框含义解释如下: 
verbose:这个选项设为true的话,会打印导入的一些中间过程的详细信息,有利于调试以及了解内部操作细节 
clean:表示是否在导入数据创建索引之前先清空掉原有的索引 
commit:表示是否立即提交索引 
optimize:表示是否优化索引 
debug: 表示是否开启调试模式

我们可以展开右面的Configuration面板,可以看到solr-data-conifg里面的内容, 如果里面的内容都是黑色,说明内容有误, 有各种属性颜色则正确, 也可以点击Reload按钮,如果刷新图标变成绿色的√, ok, 不然得好好检查下文件了

这里写图片描述

  • 选择Enttiy后,执行导入,成功后如图,我表中就3条数据,如果数据量小,带等待时间过长, 那就不要傻傻的等了, 
    看看Loging中有没有日志信息。 可以点击Refresh Status,刷新下状态。

这里写图片描述

  • 检索数据,如果检索不出来,可尝试重复一次导入操作,如果还不行,在仔细看看上面的步骤看看有什么遗漏了。

这里写图片描述

原创粉丝点击