【Hadoop入门】Hadoop2.8的安装步骤
来源:互联网 发布:某人被告知做某事 编辑:程序博客网 时间:2024/05/17 03:28
声明
1.本篇博文介绍的Hadoop(单节点)安装步骤基于以下环境进行
- 虚拟机:VMware Workstation 12.1.0
- 镜像文件:ubuntu16.10
2.Hadoop的安装步骤一共分为5大步,接下来我会一一介绍
1.关闭防火墙
安装UFW防火墙:sudo apt-get install ufw
查看防火墙状态:sudo ufw status
关闭防火墙:sudo ufw disable
默认关闭:sudo ufw default deny
重启Linux:sudo reboot
2.安装JDK8
安装JDK8:sudo apt-get install sun-java8-jdk
配置Java与Hadoop环境变量:sudo vim /etc/profile 之后在文件末尾添加
export JAVA_HOME=/home/qingaolei/hadoop/jdk1.8.0_1export JRE_HOME=${JAVA_HOME}/jreexport CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/libexport HADOOP_HOME=/home/qingaolei/hadoop/hadoop-2.8.0export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
使配置文件生效:source /etc/profile
验证JDK是否安装成功:java –version
3.配置SSH免密登录
安装SSH:sudo apt-get install ssh
配置无密码登录本机:ssh-keygen -t rsa -P “”
注:ssh-keygen表示生成密匙,-t表示生成的密匙类型,-p表示生成文件的路径,该命令执行后,会生成两个文件,id_dsa私匙和id_dsa_pub公匙
将公钥拷贝到要免登陆的机器上:ssh-copy-id localhost
验证SSH是否安装成功:ssh –version
验证是否可以免密登录:ssh localhost (第一次登录会询问是否继续连接,输入yes即可)
4.安装运行Hadoop(单节点)
- 下载Hadoop的安装包:
wget http://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/hadoop-2.8.0/hadoop-2.8.0.tar.gz
解压安装包:tar –zxvf hadoop-2.8.0.tar.gz
修改配置文件:hadoop-env.sh、core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml
1>修改 hadoop-env.sh
export JAVA_HOME=/home/hzq/software/jdk1.8.0_131
2>修改core-site.xml
<configuration> <property> <name>fs.defaultFS</name> <value>hdfs://Ubuntu:9000/</value> </property> <property> <name>hadoop.tmp.dir</name> <value>/home/dream/hadoop/data</value> </property> </configuration>
注: fs.defaultFS表示NameNode URI
hadoop.tmp.dir 表示临时文件的存放地址,默认是”/tmp/hadoop-${user.name}”
3>修改hdfs-site.xml
<configuration> <property> <name>dfs.replication</name> <value>2</value> </property> <property> <name>dfs.block.size</name> <value>64M</value> </property> </configuration>
注: dfs.replication 表示Block副本的数量 默认是3
dfs.block.size表示Block的大小 默认是128M
4>修改mapred-site.xml
<configuration> <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> </configuration>
注:mapreduce.framework.name 表示制定MR框架为Yarn方式,默认是local
5>修改yarn-site.xml
<configuration> <property> <name>yarn.resourcemanager.hostname</name> <value>centos71</value> </property> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> <configuration>
注: yarn.resourcemanager.hostname 表示指定Resourcemanager的地址
yarn.nodemanager.aux-services 表示reduce获取数据的方式
格式化namenode(初始化):hdfs namenode -format
启动Hadoop:bin/start-all.sh
或者先启动HDFS:sbin/start-dfs.sh,之后再启动YARN :sbin/start-yarn.sh验证Hadoop是否安装成功:输入网址http://localhost:50070
或者使用jps命令验证
注:
①hdfs namenode –format 命令只是初始化了namenode的工作目录,而DataNode的工作目录是在DataNode运行后产生。
②namenode初始化后形成两个标识:blockpollid和clusterId,新的DataNode加入时会获取这两个ID
③配置文件时,给NameNode配置多个工作目录,可以增强容错性。
本人才疏学浅,若有错,请指出,谢谢!
如果你在安装过程中遇到什么问题,可以在下方留言,我们一起解决!
衷心的感谢您能耐心的读完本篇博文!
- 【Hadoop入门】Hadoop2.8的安装步骤
- Hadoop入门--hadoop2伪分布式安装
- Hadoop入门--Hadoop2伪分布式安装
- Centos7安装Hadoop2.8步骤
- hadoop2.x入门:Hadoop的启动方式
- Hadoop2.7.4集群的Linux安装步骤
- Hadoop2.4.1安装步骤
- Hadoop2.6.4安装步骤
- Hadoop分布式安装hadoop2
- hadoop2伪分布式安装步骤
- 【hadoop】5004-Hadoop2.x 集群搭建步骤
- 【Hadoop入门】Hadoop安装教程_单机/伪分布式配置_CentOS6.4/Hadoop2.6.0
- Eclipse中hadoop2.7.1的插件下载及安装步骤
- Hadoop2.7.4 MapReduce集群的Linux安装步骤
- 【Hadoop】Spark2.0.2在Hadoop2.7.3上的安装
- Hadoop安装-安装步骤
- hadoop的伪分布安装步骤
- hadoop集群的安装步骤和配置
- 7月27日云栖精选夜读:AI时代_运维和测试岗位如何开启"第二春"?
- python3网络爬虫(堆糖网)
- 1080. Graduate Admission (30)
- Python的常用模块
- C++中的隐藏、重载、覆盖(重写)
- 【Hadoop入门】Hadoop2.8的安装步骤
- Servlet 8个Listener
- Google发布RAISR
- 【JAVA学习】“-Xmx1024m -Xms1024m -Xmn512m -Xss256k”——Java运行参数
- hdu6045
- Mysql的分页limit (startNum从0开始,pageSize) limit 1即查询最新的一条(相当于limit(0,1))
- Git与TortoiseGit基本操作
- NOIP2016 T2 天天爱跑步
- hdu 5692 (节点深度为h 所有子节点