heritrix 3.1.1并行抓取

来源:互联网 发布:怎么定义二维数组 编辑:程序博客网 时间:2024/05/13 03:33

当只抓取一个站点时,由于分配策略的关系,只会有一个线程去抓取,导致队列很大,抓取缓慢,3.0以后增加了parallel queue设置:

SurtAuthorityQueueAssignmentPolic下有个parallelQueues
打开注释修改这个值就可以

原创粉丝点击