nutch2.3分布式搭建
来源:互联网 发布:经典球员数据盖德穆勒 编辑:程序博客网 时间:2024/05/26 09:56
首先搭建hadoop集群。参看之前的文章:
https://note.youdao.com/share/?token=6B7AD80F6F904C1982B92E03C61B637C&gid=30499526
首先把/hadoop/etc/hadoop下面的几个文件复制到/nutch-2.3.1/conf
core-site.xmlhadoop-env.shhbase-site.xmlhdfs-site.xmlmasters(没有就新建吧,里面填Hmaster的地址)slaves
然后把Hbase/lib 下面的*.jar 复制到 hadoop/share/hadoop/mapreduce
vim /nutch-2.3.1/conf/nutch-site.xml
添加
<property> <name>plugin.folders</name> <value>/opt/apache-nutch-2.3.1/build/plugins</value></property
然后把nutch拷贝到其他机器
可能出现的问题:
Container killed on request. Exit code is 143
然后提示memory 2.7g in 2.1g used
这里是表示内存不够,所以
vim hadoop/etc/hadoop/mapred.site
<property> <name>mapreduce.map.memory.mb</name> <value>4096</value> </property> <property> <name>mapreduce.reduce.memory.mb</name> <value>4096</value> </property>
阅读全文
0 0
- nutch2.3分布式搭建
- Nutch2.3+Hbase0.94环境搭建
- nutch2.1分布式抓取
- nutch2.3 hadoop2.6.0 hbase0.98.8 分布式爬虫NoClassDefFoundError HBaseConfigurati
- 搭建Hadoop2.6+Hbase0.98.6+Nutch2.3环境
- [Nutch]Nutch2.3+Hadoop+HBase+Solr在Ubuntu环境搭建
- Nutch2.2.1 开发环境搭建
- nutch2.3 hadoop2.6.0 hbase0.98.8 分布式爬虫NoClassDefFoundError: org/apache/hadoop/hbase/HBaseConfigurati
- nutch2.0完全分布式部署配置
- Nutch2.3(一)
- Nutch2.3(二)
- Nutch2.3.1源码开发环境搭建
- Nutch2.3系列教程——Nutch2.3编译
- 【Nutch2.2.1基础教程之3】Nutch2.2.1配置文件
- 【Nutch2.2.1基础教程之3】Nutch2.2.1配置文件
- 分布式爬虫nutch2.0初体验------三大亮点
- Windows7环境下MyEclipse+Nutch2.2.1+Mysql搭建
- 搭建Hadoop2.6+Hbase0.98.20+Nutch2.3.1+solr6.0.1环境
- hexo 博客
- Hdu 5098 Smart Software Installer【思维+拓扑排序】
- c++-----string和深浅拷贝
- Hibernate Ⅱ Log4j Juit
- 有用的博客的链接
- nutch2.3分布式搭建
- flex:多栏多列弹性布局
- 同源策略与跨域
- 单例模式(Singleton)的同步锁synchronized
- H
- 华硕ASUS台式主板 改WIN7 BIOS 设置详解
- hadoop内存不足
- websocket聊天室
- Android中ViewPager常用功能3----仿微信既能点击又能滑动的选项卡