heritrix-1.14.4初学笔记
来源:互联网 发布:初学java用java7还是8 编辑:程序博客网 时间:2024/06/11 16:40
在运行heritrix过程中有个很重要的配置文件order.xml(这里面有很多配置的属性要慢慢的了解)这里面声明了运行过程中所需的所有属性
heritrix读取order.xml文件通过--org.archive.crawler.settings包下的XMLSettingsHandler类
一、order.xml文件的读取
1.要把order.xml文件封装到File中。
2.XMLSettingsHandler构造函数的参数就是那个File的对象。
3.在它父类的方法中有一个getOrder()方法 返回一个CrawlOrder的实例。
------------------------------------------------------------------------------------------
二、CrawlOrder的作用是干什么的?
org.archive.crawler.datamodel.CrawlOrder是抓取任务的起点,访问是通过它来得到任务的属性配置的。
这部分是书上的。。。
heritrix的中央处理器org.archive.crawler.framework.CrawlController
在这个类中的一些属性:
------------------------------------------------------------------------------------------------
具体内容还不清楚还没写的现在算是一个摘抄吧
// key subcomponents which define and implement a crawl in progress
//AtomicInteger,一个提供原子操作的Integer的类。在Java语言中,++i和i++操作并不是线程安全的,在使用的时候,不可避免的会用到synchronized关键字。而AtomicInteger则通过一种线程安全的加减操作接口。
------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------
------------------------------------------------------------------------------------------------
上面声明的组件关系和在CrawlController中的工作顺序是怎么样的?
CrawlController的实例化:有个不带参数的构造函数 实例化时需要完成以下任务
--------------------------------------------------------------------------------------------------
start中首先判断是否允许当前线程开始 不允许停止 允许 调用unpause()方法。
unpause()是将阻塞的线程信号设置为false,然后通过notifyAll()唤醒阻塞线程开始
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
- heritrix-1.14.4初学笔记
- heritrix-1.14.4 配置
- Heritrix-1.14.4
- eclipse中配置heritrix的过程----heritrix-1.14.4
- Eclipse 配置 Heritrix 1.14.4
- Heritrix 1.14.4 安装/使用
- Eclipse中配置Heritrix-1.14.4
- Eclipse中配置使用Heritrix-1.14.4
- eclipse里配置Heritrix-1.14.4
- Heritrix研究笔记(一)
- Heritrix-1.14.0安装
- 配置Heritrix 1.14
- Heritrix
- Heritrix
- heritrix
- heritrix
- Heritrix
- heritrix
- 关于Java调用C写的动态链接库的具体实现方法,自己捉摸了好久,现在算是来造福大众了 T _T
- TCP服务端和客户端(7)
- opengl之vsh、fsh简易介绍+cocos2dx 3.0 shader 变灰
- JDK配置环境变量
- drupal7自带image控件开启进度条
- heritrix-1.14.4初学笔记
- solr完整教程
- Java中的集合大汇总大对比大起底
- 多线程-Java原子变量-java.util.concurrent.atomic.*
- java内存模型之二---重排序
- instruments 教程
- C语言中的getopt()和getopt_long()函数
- 配置Spring数据源
- POJ 1128 Frame Stacking dfs+拓扑排序