完全分布式模式hadoop集群(hadoop2.7.3)
来源:互联网 发布:c语言苹果分级 编辑:程序博客网 时间:2024/05/16 11:13
一、运行模式
首先,认识一下hadoop的运行模式,即以下三种:
1>单机模式
在单节点运行,直接使用本地文件系统的运行方式,一般用于调试。
2>伪分布式模式
在单节点上同时启动NameNode、DataNode、JobTracker、TaskTracker、SecondaryNameNode等5个进程,各个节点模拟分布式运行的运行模式。
3>完全分布式模式
多节点分别启动NameNode、DataNode、JobTracker、TaskTracker、SecondaryNameNode等5个进程,各个节点分布式运行的运行模式。
注:以上NameNode、DataNode、JobTracker、TaskTracker、SecondaryNameNode为低版本hadoop的守护进程;高版本hadoop的守护进程为:NameNode、ResourceManager、SecondaryNameNode、DataNode、NodeManager。
二、守护进程
1> NameNode,管理文件的元数据。
2> ResourceManager,YARN中master节点的代理,负责节点上任务的分配与合并,与NodeManager的通信等。
3> SecondaryNameNode,定期备份NameNode的信息快照,NameNode宕机时该节点可切换为NameNode。
4> DataNode,存储实际数据的节点,负责把HDFS数据块读写到本地文件系统。
5> NodeManager,YARN中每个slave节点的代理,负责单节点上的计算,与ResourceManager的通信,Container的资源使用(内存、CPU等)以及追踪节点健康状况等。
三、搭建集群
1. 修改/etc/hosts文件配置域名IP映射,查看防火墙状态:/etc/init.d/iptables status,关闭防火墙:/etc/init.d/iptables stop,关闭防火墙自启动:chkconfig iptables off。
2. 配置hadoop用户。
3. 安装JAVA JDK套件,修改/etc/profile文件配置JAVA环境变量,使其即时生效:source /etc/profile。
4. 安装SSH套件,配置master(namenode)节点无密码访问slaves节点。
1> 生成公-私秘钥对:ssh-keygen -t rsa -f ~/.ssh/id_rsa。
2> 开启sshd服务,检查sshd服务状态:service sshd status,开启sshd服务:service sshd start,开启sshd服务自启动:chkconfig --add sshd; chkconfig sshd on。
3> 配置无密码登录:ssh-copy-id username@host(复制master节点的id_rsa.pub至自己以及各个slave节点的authorized_keys文件)。
5. 安装HADOOP套件,修改hadoop配置文件(hadoop-env.sh、core-site.xml、hdfs-site.xml、mapred-site.xml、slaves)
1> 修改hadoop-env.sh文件,配置JAVA_HOME变量,倘若配置文件放在非/etc/hadoop/目录,则需要配置HADOOP_CONF_DIR变量。
2> 修改core-site.xml文件。
3> 修改hdfs-site.xml文件。
4> 修改mapred-site.xml文件,将mapred-site-template.xml修改为mapred-site.xml。
5> 修改yarn-site.xml文件。
6> 修改slaves文件,低版本还需修改masters文件。
6. 分发hadoop到各个slave节点。
7. 格式化namenode:hadoop namenode -format。
8. 在master节点启动HADOOP的各个deamon进程,${HADOOP_HOME}/sbin/start-all.sh
9. 使用jps验证各个deamon进程是否开启。
注:
防火墙问题解决:http://blog.csdn.net/liuxinghao/article/details/40121945
- 完全分布式模式hadoop集群(hadoop2.7.3)
- VM12+CentOS6.5+hadoop2.7.3 搭建hadoop完全分布式集群
- 完全分布式的hadoop集群搭建-hadoop2.7.3
- Hadoop分布式集群搭建(二 )完全分布式模式
- Hadoop2.7.3完全分布式集群安装过程
- Hadoop2.7.3完全分布式集群搭建
- hadoop2.5.1集群部署(完全分布式)
- 【Hadoop】hadoop2.7完全分布式集群搭建以及任务测试
- VM+CentOS+hadoop2.7搭建hadoop完全分布式集群
- hadoop学习之hadoop2.8.0完全分布式集群安装
- 搭建hadoop完全分布式集群VM+CentOS+hadoop2.7
- hadoop学习之hadoop2.8.0完全分布式集群安装
- 搭建hadoop完全分布式(hadoop2.2)
- Hadoop集群完全分布式模式环境部署
- Hadoop集群完全分布式模式环境部署
- Hadoop集群完全分布式模式环境部署
- Hadoop集群完全分布式模式环境部署
- Hadoop集群完全分布式模式环境部署
- ubuntu recovery mode
- 变态跳台阶
- 合并两个排序链表
- 欢迎使用CSDN-markdown编辑器
- leetcode- Symmetric Tree
- 完全分布式模式hadoop集群(hadoop2.7.3)
- 04-树4 是否同一棵二叉搜索树
- ORACLE rac集群概念和原理
- android 事件分发笔记
- sed命令处理文本中的一点应用
- Linux关机指令
- 合并两个排序链表
- 快速排序
- 关于dll加载失败原因总结