初步接触全文检索小记

来源:互联网 发布:淘宝小二会旺旺联系吗 编辑:程序博客网 时间:2024/04/29 17:15

【全文检索功能优化的更新步骤】

全文检索功能有一个索引生成工具,有一个目录,放置了字典文件夹和一系列文件。

由于媒资系统当下较慢,需要重新生成索引。在生成索引这段时间,需要保证先前的全文检索是可用的。


这就需要对媒资系统中索引文件的路径重新配置,然后将老的字典文件等移走,使两者仍保持对应关系,这样全文检索就仍然可用。


然后把媒资系统中全文检索表中的记录状态为发布状态的ID字段插入到全文检索临时表中。这样就可以使用索引生成工具重新生成索引文件了(要确保目录下有字典文件)。

 

当生成工具提示“没有新的索引可生成”时,就可以对媒资系统的全文检索功能相关文件重新映射了。即恢复路径的配置,指向新生成的索引文件。


重启媒资系统,即可使得新的全文检索生效。




我有两个问题:

1.对全文检索的功能进行优化为啥需要重新生成全文检索?是不是每隔一段时间都需要进行这样的操作?

答:第一次要把所有的数据生成索引,以后就只有把新入库的数据生成索引就行了

2.全文检索的原理是怎样的?这些文件是如何在页面上点击全文检索按钮时发挥作用?

答:这可能需要我在接下来的lucene学习中搞清楚吧。


另外,今天更新的时候,在索引生成工具重新生成索引期间,全文检索功能失效,报错“没有找到字典文件”,原因是我们有两台媒资服务器,只把老的索引文件移到了其中一台,而没有拷贝到另一台上,所以会出错。


后续:我想在我的机器上也实现全文检索,于是请同事把索引文件发给了我,放在了媒资系统中config.properties文件中指定的路径下,结果报tomcat内存溢出的错误,解决方式是,

eclipse->preference->java->instal jres->edit,在Default VM Arguments一栏中增加参数:-Xms256m -Xmx512m

然后问题得到解决,全文检索可以顺利使用了。


接下来我要学习一下Lucene了。相信通过一段时间的学习我会对其原理和使用有一定的了解的。