使用 Hadoop,Nutch ,Hbase,Solr 搭建搜索引擎之Nutch2.2.1
来源:互联网 发布:qq邮箱服务器端口 编辑:程序博客网 时间:2024/04/26 20:26
这篇文章小编讲解Nutch2..2.1的搭建,前提是已经搭建好了hadoop,以及Hbase,还没有搭建好的可以参考小编的这两篇文章。
Hadoop搭建:http://blog.csdn.net/shuaigexiaobo/article/details/77481391
Hbase搭建:http://blog.csdn.net/shuaigexiaobo/article/details/77503199
Nutch环境搭建, Nutch2.2.1安装过程
(一)进入或者创建usr/local/nutch文件夹
(二)修改目录权限
sudo chmod 777 -R nutch
(三)在nutch文件夹下下载apache-nutch-2.2.1-src
wget https://archive.apache.org/dist/nutch/2.2.1/apache-nutch-2.2.1-src.tar.gz
(四)在nutch文件夹中解压apache-nutch-2.2.1-src
tar -zxvf apache-nutch-2.2.1-src.tar.gz(五)修改./conf/gora.properties增加如下一行
gora.datastore.default=org.apache.gora.hbase.store.HBaseStore(六)修改./conf/nutch-site.xml
<configuration> <property> <name>storage.data.store.class</name> <value>org.apache.gora.hbase.store.HBaseStore</value> <description>Default class for storing data</description> </property> <property> <name>http.agent.name</name> <value>My Nutch Spider</value> </property> <property> <name>plugin.includes</name> <value>protocol-httpclient|urlfilter-regex|index-(basic|more)|query-(basic|site|url|lang)|indexer-solr|nutch-extensionpoints|protocol-httpclient|urlfilter-regex|parse-(text|html|msexcel|msword|mspowerpoint|pdf)|summary-basic|scoring-opic|urlnormalizer-(pass|regex|basic)protocol-http|urlfilter-regex|parse-(html|tika|metatags)|index-(basic|anchor|more|metadata)</value> </property></configuration>(七)修改./ivy/ivy.xml
将依赖的Hadoop-core和hadoop-test的版本由1.2.0改为1.2.1将gora-hbase依赖解除注释如下:
<dependency org=”org.apache.gora” name=”gora-hbase” rev=”0.5″ conf=”*->default” />(八)在apach-nutch-2.3目录中 输入 ant 命令
成功后将完成Nutch的安装。
阅读全文
0 0
- 使用 Hadoop,Nutch ,Hbase,Solr 搭建搜索引擎之Nutch2.2.1
- 使用 Hadoop,Nutch ,Hbase,Solr 搭建搜索引擎之Hadoop1.2.1搭建
- 使用 Hadoop,Nutch ,Hbase,Solr 搭建搜索引擎之Hbase-0.94.27.搭建
- [Nutch]Nutch2.3+Hadoop+HBase+Solr在Ubuntu环境搭建
- 使用 Hadoop,Nutch ,Hbase,Solr 搭建搜索引擎之搭建solr4.9.1
- 【Nutch2.2.1基础教程之2.2】集成Nutch/Hbase/Solr构建搜索引擎之二:内容分析
- 【Nutch2.2.1基础教程之2.2】集成Nutch/Hbase/Solr构建搜索引擎之二:内容分析
- 【Nutch2.3基础教程】集成Nutch/Hadoop/Hbase/Solr构建搜索引擎:安装及运行【集群环境】
- 【Nutch2.3基础教程】集成Nutch/Hadoop/Hbase/Solr构建搜索引擎:安装及运行【集群环境】
- 【Nutch2.2.1基础教程之2.1】集成Nutch/Hbase/Solr构建搜索引擎之一:安装及运行【单机环境】
- 【Nutch2.2.1基础教程之2.1】集成Nutch/Hbase/Solr构建搜索引擎之一:安装及运行【单机环境】
- 使用 Hadoop,Nutch ,Hbase,Solr 搭建搜索引擎抓取并测试搜索结果
- nutch/solr/lucene//hadoop/hbase 搜索引擎
- 利用nutch、hbase和solr搭建搜索引擎
- Nutch + Solr + Hadoop 搭建分布式搜索引擎详细教程
- hadoop+nutch+solr搜索引擎配
- 【Apache Nutch系列】Nutch2.2+hadoop+hbase+zookeeper环境部署
- nutch2.2.1之hbase部署
- Square Coins(HDU1398)
- 语义网简介(一)
- BaseItemLayout一行代码实现一些通用的 Item 布局
- C++ 常量指针和指针常量
- Working out (数字三角形升级版)
- 使用 Hadoop,Nutch ,Hbase,Solr 搭建搜索引擎之Nutch2.2.1
- 新手上路的日志
- 百度MIP组件使用方法:mip-list mip-infinitescroll等
- 变量的传值与传引用
- 【今日头条笔试题】找一组坐标点的右边界点
- 洛谷2342 叠积木
- 内核回顾
- jquery.cookie() 方法的使用(读取、写入、删除)
- U-Boot 修改MAC地址