关于 Eclipse中运行Nutch No URLs to fetch的问题解决

来源:互联网 发布:两个表格找出不同数据 编辑:程序博客网 时间:2024/05/20 02:30

      今天着实郁闷了一把; 下午调试Nutch, 发现老报No URLs to fetch 的问题,

 

上网搜索发现 遇到这问题的人还真不少,结论也是千奇百怪;结果挨个试验一一下大家

 

的做法; 特别是百度博客的那位仁兄简直就是把我带沟里去了;

 

http://hi.baidu.com/cjjic02/blog/item/494b12256445c46735a80f56.html 里

 

说把 outputfolder 指为 conf ,让我那个晕菜~ 没听说 src 和output还能配成

 

一个路径的; 还有一种说法是crawl-urlfilter配置不对的问题, 还有就是URL.txt文件必须还有1--2个url地址的说法;

 

     越来越晕了~  后来干脆谁也别信了。自己挨个查代码,终于发现这个bug在哪了;不得不怀疑现在apache的基金状况每况愈下了。 源码里居然还能藏着机锋; 大家import 代码的时候别把test也倒进来,那里面也有一个引发冲突的nutch-site.xml 。 有人这时要说了,我看了编译路径里调用的是 conf下的那个,没错呀!~ 嘿嘿,谁用谁知道~ 此问题解决后 再把 503,467的patch 一打 ,应该就没啥问题了; That's all.....