nutch学习笔记(慢慢补充)
来源:互联网 发布:unity3d创建地形 编辑:程序博客网 时间:2024/05/18 01:01
1。fetcher线程的循环逻辑
1)如果有严重错误,则中断
2)从FetchList获得下一个fetch条目,如果没有,则退出
3)从fetch条目中提取URL信息
4) 如果没有被标记为抓取,就调用this.handleNoFetch(),并置状态为status=1,接着执行:
1,获得URL的MD5 摘要
2,创建一个FetcherOutput(fle, hash, status)
3,
1)如果有严重错误,则中断
2)从FetchList获得下一个fetch条目,如果没有,则退出
3)从fetch条目中提取URL信息
4) 如果没有被标记为抓取,就调用this.handleNoFetch(),并置状态为status=1,接着执行:
1,获得URL的MD5 摘要
2,创建一个FetcherOutput(fle, hash, status)
3,
- nutch学习笔记(慢慢补充)
- 机器学习中的数学(慢慢补充)
- Nutch学习笔记(一)
- NUTCH学习笔记汇总
- nutch 学习笔记
- Nutch学习笔记
- Nutch学习笔记二
- Nutch学习笔记三
- Nutch 学习笔记 2
- Nutch 1.3 学习笔记
- Nutch+Solr学习笔记
- Nutch学习笔记
- quartz----学习笔记(补充)
- Spring 学习时遇到错误整理贴(会慢慢补充)
- Nutch 0.7.2 学习笔记
- Nutch 1.3 学习笔记1
- Nutch 1.3 学习笔记2
- Nutch学习笔记1 ---------Inject
- 创建你的第一个自定义jsp tag(jsp标签)
- 今天玩得不开心
- P2P工作原理和技术演进
- VC下获取各个驱动器路径,分类及其获取其信息的资料整理
- ASCII编码表
- nutch学习笔记(慢慢补充)
- ASP与数据库连接
- 【例子】一个小益智游戏(过河游戏)的求解
- 字符串中数字的提取
- Linux下的sniffer工具--Tcpdump的安装和使用
- 适应安装程序用的TreeView控件
- 多域控制器环境下Active Directory灾难恢复
- 串口电平
- 阶乘求法