Lucene学习笔记(3)(竹笋炒肉)
来源:互联网 发布:人人商城v2 源码 编辑:程序博客网 时间:2024/04/28 07:57
Lucene学习笔记(3)
由于文档不全,这次看代码看得很苦,几乎是用log4j一个类一个方法的看过来的。令人高兴的是,期间请教车东时,他说到要重新整理一下整个项目的源代码和文档,估计后来者可以轻松矣。
除了以前提到的汉化外,车东在这个项目中,加入了很多实用的东东,如反显、排序、摘要等,甚至也连网页过期时间、输出格式的限制都考虑到了。
下面是我的测试页面,大家看看先。等明天我把源代码diff一下,把我做的修改文件也挂上来,供大家参考。
在车东的简历上,有一个商业检索网址,估计是车东他们的成绩,可以去看看,也帮助理解这个项目的功能。
下面是运行weblucene需要作得改动和说明。
|-- WEB-INF
| |-- classes
| | `-- com
| | `-- chedong
| | |-- weblucene
| | |-- WebLuceneAdminServlet.java
| | |-- index
| | | `-- SAXIndexer.java
| | `-- search
| | `-- WebLuceneHighlighter.java
| |-- logs <-----这是一个子目录,手工建立后程序运行时log文件在这个目录下。
| `-- var
| `-- app
| |-- index <-----这是一个子目录,手工建立后索引时将索引文件放在这儿。
| |-- weblucene.xsl
| `-- wl.conf
|-- index.html
|-- style.css
`-- test.xml
对SAXIndexer.java的修改
将两行
sb.append(luceneDoc.getField((String) it.next()));
改为两行
sb.append(luceneDoc.get((String) it.next()));
对WebLuceneHighlighter.java的修改
将两处<u>改为<ins>
将两处</u>改为</ins>
对WebLuceneAdminServlet.java可改可不改
建议将
logFileName = servletConfig.getServletContext().getRealPath("WEB-INF/logs/")
+ logFileName;
改为
logFileName = servletConfig.getServletContext().getRealPath("WEB-INF/logs/")
+ "/" + logFileName;
除了三个java程序外,其它文件都可以从这儿下载.
通过web进行检索前,需要先建立索引,命令如下:
需要再说一句,就是估计车东会很快推出一个崭新的实用性更强的版本,到那时此处可供下载的内容估计都没有用了。:)
- Lucene学习笔记(3)(竹笋炒肉)
- Lucene学习笔记(2)(竹笋炒肉)
- Lucene学习笔记(1)(来自:竹笋炒肉)
- 竹笋炒肉的cocoon学习笔记
- 竹笋炒肉: Jmagick学习笔记
- 竹笋炒肉转载 -- 读《Effective java 中文版》(3)
- 竹笋炒肉转载 -- 读《Effective java 中文版》(1)
- 竹笋炒肉转载 -- 读《Effective java 中文版》(2)
- 竹笋炒肉转载 -- 读《Effective java 中文版》(4)
- 竹笋炒肉转载 -- 读《Effective java 中文版》(5)
- TrackBack新手指南(编译)--转自竹笋炒肉
- Lucene学习笔记(3)
- Lucene学习笔记(1)-Hello Lucene
- Lucene学习笔记(一)-------Lucene基础
- Lucene学习笔记(3)-索引操作
- Lucene.NET学习笔记(3)
- Lucene学习笔记(一)
- lucene学习笔记(一)
- [J2SE 5.0专题][4]其他重要更新
- 你会打电话吗
- VB程序实现WindowsXP效果的界面------选择自 cuizm 的 Blog
- blog里的编辑器是垃圾 ,超级垃圾 。 。 。
- 微软的站点搜索引擎内幕 (zt)
- Lucene学习笔记(3)(竹笋炒肉)
- Lucene学习笔记(2)(竹笋炒肉)
- 唐敏:中国软件困境在软件工程薄弱
- Lucene学习笔记(1)(来自:竹笋炒肉)
- wereew
- 运行OpenLdap
- 用API修改注册表的完整模块 选择自 goodname008 的 Blog
- 杨振宁:凭什么要大家尊重你?
- 一个绝对经典的在VB中操作.ini文件的通用类源代码 选择自 goj2000 的 Blog