操他妈的!终于成功了!!!日啊。。。UBUNTU下NUTCH1.1网页搜索结果总为0解决,太悲剧了。。。
来源:互联网 发布:二战美军知乎 编辑:程序博客网 时间:2024/04/30 00:18
UBUNTU下配置NUTCH1.1,按照书上<Lucene+Nutch 搜索引擎开发>一步一步来,前面都是成功的,包括建索引和对索引的搜索,但是到了从网页搜索索引的时候却总是返回0,。。。好无语了。。。网上绝大部分都是说要更改配置文件,增加至 nutch/WEB-INF/classes 下 nutch-site.xml ,增加配置为
<property>
<name>http.agent.name</name>
<value>*</value>
<description></description>
</property>
<!-- file properties -->
<property>
<name>searcher.dir</name>
<value>D:/nutch-0.8.1/crawled</value>
<description></description>
</property>
</configuration>
实验发现http.agent.name中的value很无所谓的。。。设成什么都行。。。靠。。。searcher.dir就是索引所在的目录,但是我这样设置了依然总是返回0个结果。。。就在我绝望的时候。。。我决定去打飞机?NO。。。决定重装Tomcat,实在不行就放弃这一步,明天继续往下走。。。因为我没有找到tomcat的conf文件jia,面好像有个错误就是提示找不到conf/server.xml,因为我的Tomcat是用ubuntu10.04的软件安装包直接安装的,我把网上的各种解决方案都看了,实在不行了就怀疑到了TOMCAT。。。去apatch-tomcat下载了最新的tomcat,解压,运行。。。起了个项目名字叫 FUCKROOT...结果FUCK成功了。。。真是太悲哀了。。。被一个UBUNTU自动安装的TOMCAT6给耍了。。。唉。。。
同时发现一个问题,就是在eclipse中执行crawl去抓取网页跟直接在UBUNTU下用命令行去执行
bin/nutch crawl multiurls.txt -dir crawleddd -depth 2 -topN 50 -threads 10
- 操他妈的!终于成功了!!!日啊。。。UBUNTU下NUTCH1.1网页搜索结果总为0解决,太悲剧了。。。
- 操你妈的 太麻烦了
- 终于在Ubuntu下成功下载了Android源代码
- linux下db4.x-util的安装问题,终于成功了(Ubuntu)
- 悲剧啊~装了ubuntu后Windows启动项没了~解决原来如此简单(已解决)
- 4年成为一个产品线的架构师!我操,我他妈太慢了!
- 啊日,太耀眼了
- Hotmail终于升级为2000MB了,太高兴了
- 用了半天时间,终于在ubuntu下成功安装了zend studio
- 终于解决了fedora16部分网页打不开的问题
- 终于搞定了不同线程间的相互操着
- 太他妈的让人感动了,年度大戏啊![哈哈]
- 呵呵,终于成功了
- 终于申请成功了!!
- 终于申请成功了!!
- 终于注册成功了!
- 终于成功了
- 终于安装成功了!
- QButtonGroup的简单应用
- 碰了碰 云
- MTK HISTORY 小结 6
- UML图
- 开机gnome无法启动,提示gconf-sanity-check-2------ubuntu系统处理
- 操他妈的!终于成功了!!!日啊。。。UBUNTU下NUTCH1.1网页搜索结果总为0解决,太悲剧了。。。
- 在C#中如何动态创建access数据库并对SQLserver中的数据导入进去
- 大三开学总结!
- TCP和UDP各包含了哪些协议
- Pin to Taskbar
- 连傻瓜都能看懂的基于代码注入的线程守护技术
- 学习方向
- RTTI 运行时类型识别
- 类型转换操作符