老紫竹网页采集系统-0.3版发布(LzzSearch 0.3),支持不同的存储
来源:互联网 发布:linux中more和less 编辑:程序博客网 时间:2024/04/29 07:54
老紫竹网页采集系统(LzzSearch)变更历史
===================================
2009-02-05 v0.3
---------------
* 增加了存储接口,可以将数据用不同的方式保存
* 确定系统里url是唯一的
* 调整 Lucene 实现存储接口
* 数据项增加了id属性,用来保存唯一的编号,比如lucene的docId,数据库的id主键等
* 增加基于数据库的存储实现(MySQL+JDBC),采用标准SQL
* 数据库存储使用了新的类库
commons-dbcp-1.2.2.jar
mysql-connector-java-5.1.7-bin.jar
commons-pool-1.4.jar
* 在源代码的sql目录下增加了MySQL 5.1.30 版的创建表格的SQL文件
* applicationContext.xml 增加了MySQL的数据源和对应的MySQL存储的配置
* 在demo里面增加了针对MySQL的测试例子
* 其它存储方式(比如文件存储)的实现,可以通过实现Store接口即可
* util下增加了一个DBUtil类,用来释放数据库资源
# 后面重点是功能展示部分,开发B/S的部分,至于C/S的,因为本人不熟悉,只好请"你"或者别的网友代劳了。
包括url添加,url搜索,内容检索这三个基本功能,稍后再增加用户注册等个性化部分。
2009-02-03 v0.2
------------------------
* 增加了对Lucene 2.4 的支持,保存采集内容并对提供搜索和内容更新
* 使用了庖丁解牛做中文分词
* 修正了 StrTools 里面对于<br />不能正确文本替换的BUG
* 增加了专用的TestLucene的演示程序
* 更改test目录名为demo
* 的Lucene的索引目录在applicationContext.xml里面进行修改,默认为 d:/indexpaoding/lzzSearch
* 调整了项目目录,将需要的5个jar都放到了项目内部,无需单独下载了
* 注意:庖丁所需要的dic我已经放到了系统内部,在src/dic下面
并且更新了paroding-analysis.jar里面的 paoding-dic-home.properties文件的配置
2009-02-02 v0.1
------------------------
* 基于Spring的配置,可以轻松的增加采集的站点
* 采集点包含标题,作者,发布时间和内容四部分
* 采集后的内容由用户自行
下载和反馈地址
老紫竹网页采集系统-0.3版发布(LzzSearch 0.3)
- 老紫竹网页采集系统-0.3版发布(LzzSearch 0.3),支持不同的存储
- 老紫竹网页采集系统(lzzSearch 0.1版)发布
- 老紫竹网页采集系统-0.2版发布(LzzSearch 0.2)
- 老紫竹精确搜索系统(LzzSearch)1.2.2发布
- 老紫竹搜索(LzzSearch 0.4b)测试站点开通
- 【老紫竹收藏+搜索系统】正式测试,完毕后发布1.0的源代码
- 老紫竹B/S文件管理系统(webfile 0.1版)发布
- 老紫竹精确搜索1.01版发布,增加了SWT制作的客户端程序
- 老紫竹精确搜索系统 V1.0正式发布[提供完整源代码下载]
- 老紫竹的华为面试之旅
- 跟老紫竹学Java的说明
- 我的昵称为什么叫老紫竹?
- 老紫竹JAVA提高教程的说明
- 老紫竹的华为面试之旅
- 跟老紫竹学Java-图书销售系统-我的订单列表界面orderList.jsp
- 跟老紫竹学Java-图书销售系统
- 跟老紫竹学Java-图书销售系统-项目下载
- 跟老紫竹学Java-图书销售系统-POJO类
- 尝试
- 给Adobe Reader添加书签功能
- Fckeditor 上传附件功能比如:doc之类
- mysql所有列显示为一个字段
- Windows Mobile常用程序代码
- 老紫竹网页采集系统-0.3版发布(LzzSearch 0.3),支持不同的存储
- 一杯水蕴含的道理
- java面试题集
- 一个ORA-16014和ORA-00312错误的解决
- java面试题2
- 汽车过敏和软件纠错
- 键盘事件的响应(方向键)
- 2009.02.04
- 【转帖】产品设计体会