用Eclipse開發Nutch準備工作
来源:互联网 发布:js判断是不是ie11 编辑:程序博客网 时间:2024/06/07 10:00
原博客可能需要翻墙,遂转载至此
原始地址:http://zettadata.blogspot.com/2011/12/eclipsenutch.html
環境說明
- 作業系統: Windows XP sp3
- Eclipse Indigo Service Release 1
- Java JDK 1.6.17
- Subclipse 1.6.x
- IvyDE
- Maven Integration for Eclipse 1.0 SR1
軟體安裝
- 下載 Eclipse http://www.eclipse.org/downloads/
- 下載eclipse-jee-indigo-SR1-win32.zip
- 解開壓縮檔 eclipse 目錄
- 執行目錄中eclipse.exe執行檔
- 指定workspace位置
- 安裝 subclipse 1.6.x
- 從eclpise下拉式選單選擇Eclipse Marketplace (Help->Eclipse Marketplace)
- 搜尋 subclipse
- 確認使用者授權
- 安裝中
- 需要重新啟動 eclipse
- 在Eclipse Marketplace依據類似步驟安裝 IvyDE 2.1.0
- 再用同樣步驟安裝m2e(Maven Integration for Eclipse )
安裝 Nutch
- 在Eclipse選單中 File->New->Project->SVN->自SVN取回專案
- 建立新的檔案庫位置 https://svn.apache.org/repos/asf/nutch/trunk
此處可能會有透過PROXY取檔問題,請參考
http://eureka.ykyuen.info/2010/03/09/eclipse-configure-proxy-for-subclipse/
- 選擇根節點,並按下Finish
- 後續會導到開啟新專案畫面,選擇 Java->Java Project
- 命名專案名稱 Nutch,並確認勾選 Create separate folders for sources and class files
- 取回程式原始碼中
- 取回原始碼後,請勿在此時編譯(Build) 。請先確認目錄下沒有.project 及 .classpath 檔案,也沒有 runtime目錄。
在Eclipse中設定Nutch環境
- 請在Package Explorer中Nutch[nutch/trunk]根節點上按右鍵,選擇Properties後,在左方選擇Java Build Path,將出現以下畫面
- 在Source中移除(Remove)唯一的目錄Nutch/src,再新增目錄(Add Folder )時,展開Nutch/src的目錄,選擇Nutch/src/bin、Nutch/src/java、Nutch/src/test以及Nutch/src/testsources
- 展開Nutch/src/plugin目錄,並將每個子目錄中的src/java、src/test選取(可能會花一點時間)
- 切換到Libraries分頁,選擇(Add Class Folder)按鈕,新增 Nutch/conf
- 同樣是Libraries分頁,選擇(Add Jars)按鈕,新增src/plugin/urlfilter-automaton/lib/automaton.jar 及 src/plugin/parse-swf/lib/javaswf.jar
- 同樣是Libraries分頁,選擇(Add Library)按鈕,在以下視窗中選擇IvyDE Managed Dependencies,選擇Nutch/ivy/ivy.xml檔案,並在下一步驟中將所有的設定值(Configuration)都勾選。
- 切換至Order and Export分頁,找出Nutch/conf目錄,並將其移到最上方(Top)
- 請勿將Nutch/Build放到Class Path中,至此您可以按下完成(Finish)按鈕。
設定Nutch
- 請參考Nutch官方網站Wiki中的導覽 http://wiki.apache.org/nutch/NutchTutorial
- 請確認在$NUTCH_HOME/conf/nutch-site.xml 設定檔中有將"plugin.folders" 設定為"./src/plugin"
建置(Build) Nutch
- 將nutch目錄下的build.xml拖曳到Ant View之中,就可以開始建置Nutch了。
- 建置成功可以在Console中看到以下資訊
BUILD SUCCESSFUL
Total time: 10 minutes 21 seconds
請開始進入Nutch的世界吧!!!
- 用Eclipse開發Nutch準備工作
- Nutch爬虫工作流程
- Nutch Crawler工作流程
- 搜索引擎工作原理(Nutch)
- Nutch Crawler工作流程
- Nutch工作流程
- nutch工作原理
- Nutch 一般工作流程
- Nutch工作流程
- nutch工作原理
- nutch工作流程简介
- eclipse中导入nutch
- 备忘录:Nutch+eclipse配置
- 备忘录:Nutch+eclipse配置
- eclipse运行nutch-1.7
- eclipse导入nutch
- eclipse导入nutch源代码
- nutch 2.* 导入eclipse
- ZSD017出货达成率
- 工作日记
- Android开发平台搭建完全指南
- buttondownfcn 用法 matlab
- MonkeyRunner_Examples(1)
- 用Eclipse開發Nutch準備工作
- Windows Phone Mango编程实践——本地数据库
- VC6下Excel文件的读取和写入
- storm分配topology的关键代码注释
- spring 中StoredProcedure的用法
- 导入SQLSERVER备份文件问题
- Web页面性能分析工具YSlow开源
- JAVA启动参数大全之一:标准参数
- ZSD018出货明细表