CENTOS7搭建伪分布式HADOOP2.7.3
来源:互联网 发布:网络社区模式案例分析 编辑:程序博客网 时间:2024/05/17 20:38
一、下载安装JDK1.8.1
http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html
archive.apache.org/dist/hadoop/core/stable
1.建立一个文件夹存放解压后的hadoop程序itcast
#cd root/
#mkdir itcast
2.解压下载的hadoop-2.7.3.tar.gz到itcast目录
#tar -zxvf hadoop-2.7.3.tar.gz -C /root/itcast
2.1修改/etc/profile文件,末行加入
unset i
unset -f pathmunge
export JAVA_HOME=/usr/latest/jdk1.8.0_121
export HADOOP_HOME=/root/itcast/hadoop-2.7.3/
第一个:hadoop-env.sh
#cd itcast/hadoop2.7.3/etc/hadoop
#vim hadoop-env.sh
将$JAVA_HOME的路径改为绝对路径
第二个:hadoop
<configuration>
<!-- 用来指定HDFS的老大(NameNode)的地址 -->
<property>
<name>fs.defaultFS</name>
<value>hdfs://itcast01:9000</value>
</property>
<!-- 用来指定Hadoop运行时产生的文件-->
<property>
<name>hadoop.tmp.dir</name>
<value>/root/itcast/hadoop-2.7.3/tmp</value>
</property>
</configuration>
第三个:hdfs-site.xml
#vim hdfs-site.xml
<configuration>
<!-- 指定HDFS保存数据副本的数量 -->
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>
第四个:mapred-site.xml,如果没有就将template的cp一份.xml就可以
#mapred-site.xml
<configuration>
<!-- 告诉Hadoop以后MR运行在YARN上 -->
<property>
<name>mapreduce.framework.name</name>
<!-- 注意大小写 -->
<value>yarn</value>
</property>
</configuration>
第五个:yarn-site.xml
<configuration>
<!-- NodeManager获取数据的方式是shuffle -->
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<!-- 指定YARN的老大(ResourceManager) -->
<property>
<name>yarn.resourcemanager.hostname</name>
<!-- 如果YARN外部无法登陆,就使用IP地址 -->
<value>itcast01</value>
</property>
</configuration>
#hadoop namenode -format(过时但依然可用)
#hdfs namenode -format(新命令)
执行其中一个就好
格式化成功会显示has been successfully formatted
如果不成功需要按error提示去修改配置文件
成功后会产生tmp目录
5.启动HDFS和YARN,需要输入多次密码,因为没配置ssh,在后面配置
#./start-all.sh(过时但依然可用)
也可以分开启动
启动后查看
#jps
6000 NameNode
6608 NodeManager
47072 Jps
3634 GetConf
6338 SecondaryNameNode
6503 ResourceManager
6124 DataNode
如果都存在,就算有问题,也不会太大
三、测试登录
1.WEB登陆
http://10.31.18.78:50070 (HDFS管理界面,可以直接访问,但访问filesystem需要配置映射关系)
例如:在windows配置映射关系,编辑文件system32\drivers\etc\hosts
在#127.0.0.1 localhost
#::1 localhost
下面加入
10.31.18.78 localhost
http://10.31.18.78:8088 (YARN管理界面)
如果登陆不了,请查看YARN-SITE.XML的配置
2.上传文件
上传
#hadoop fs -put /root/Downloads/jdk-8u121-linux-x64.tar.gz hdfs://itcast01:9000/jdk
下载
hadoop fs -get hdfs://itcast:9000/jdk /home/jdk1.8
测试一个统计动作,wordcount
#hadoop fs -put /root/itcast/hadoop2.7.3/words hdfs://itcast01:9000/words
#hadoop jar hadoop-mapreduce-examples-2.7.3.jar wordcount hdfs://itcast:9000/words hdfs://itcast01:9000/wcount
1.进入.ssh文件夹
#cd ~
#cd .ssh
#ls -al <--只有一个文件known_hosts(只知道自己)-->
2.生成一对密钥,一个公钥一个私钥,非对称加密
#ssh-keygen -t rsa <-- -t rsa是一种加密方式 -->
三次回车后,ls查看发现生成了两个文件,id_rsa(私钥)和id_tsa.pub(公钥)
3.把公钥拷贝给自己,自己就可以免登陆自己。用cp命令创建一个authorized_keys(文件名不能改)
#cp id_rsa.pub authorized_keys
或者
#ssh-copy-id itcast01
如果要免密码登陆别的机器,就需要将自己的公钥拷贝给对应机器直接使用
#ssh-copy-id 10.31.18.88
测试
#ssh itcast01
可以发现不需要密码就可以登录了
http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html
安装JDK,配置换将变量
archive.apache.org/dist/hadoop/core/stable
1.建立一个文件夹存放解压后的hadoop程序itcast
#cd root/
#mkdir itcast
2.解压下载的hadoop-2.7.3.tar.gz到itcast目录
#tar -zxvf hadoop-2.7.3.tar.gz -C /root/itcast
2.1修改/etc/profile文件,末行加入
unset i
unset -f pathmunge
export JAVA_HOME=/usr/latest/jdk1.8.0_121
export HADOOP_HOME=/root/itcast/hadoop-2.7.3/
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin
刷新配置
#source /etc/profile
3.配置伪分布式,要修改5个配置文件第一个:hadoop-env.sh
#cd itcast/hadoop2.7.3/etc/hadoop
#vim hadoop-env.sh
将$JAVA_HOME的路径改为绝对路径
第二个:hadoop
<configuration>
<!-- 用来指定HDFS的老大(NameNode)的地址 -->
<property>
<name>fs.defaultFS</name>
<value>hdfs://itcast01:9000</value>
</property>
<!-- 用来指定Hadoop运行时产生的文件-->
<property>
<name>hadoop.tmp.dir</name>
<value>/root/itcast/hadoop-2.7.3/tmp</value>
</property>
</configuration>
第三个:hdfs-site.xml
#vim hdfs-site.xml
<configuration>
<!-- 指定HDFS保存数据副本的数量 -->
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>
第四个:mapred-site.xml,如果没有就将template的cp一份.xml就可以
#mapred-site.xml
<configuration>
<!-- 告诉Hadoop以后MR运行在YARN上 -->
<property>
<name>mapreduce.framework.name</name>
<!-- 注意大小写 -->
<value>yarn</value>
</property>
</configuration>
第五个:yarn-site.xml
<configuration>
<!-- NodeManager获取数据的方式是shuffle -->
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<!-- 指定YARN的老大(ResourceManager) -->
<property>
<name>yarn.resourcemanager.hostname</name>
<!-- 如果YARN外部无法登陆,就使用IP地址 -->
<value>itcast01</value>
</property>
</configuration>
#hadoop namenode -format(过时但依然可用)
#hdfs namenode -format(新命令)
执行其中一个就好
格式化成功会显示has been successfully formatted
如果不成功需要按error提示去修改配置文件
成功后会产生tmp目录
5.启动HDFS和YARN,需要输入多次密码,因为没配置ssh,在后面配置
#./start-all.sh(过时但依然可用)
也可以分开启动
启动后查看
#jps
6000 NameNode
6608 NodeManager
47072 Jps
3634 GetConf
6338 SecondaryNameNode
6503 ResourceManager
6124 DataNode
如果都存在,就算有问题,也不会太大
三、测试登录
1.WEB登陆
http://10.31.18.78:50070 (HDFS管理界面,可以直接访问,但访问filesystem需要配置映射关系)
例如:在windows配置映射关系,编辑文件system32\drivers\etc\hosts
在#127.0.0.1 localhost
#::1 localhost
下面加入
10.31.18.78 localhost
http://10.31.18.78:8088 (YARN管理界面)
如果登陆不了,请查看YARN-SITE.XML的配置
2.上传文件
上传
#hadoop fs -put /root/Downloads/jdk-8u121-linux-x64.tar.gz hdfs://itcast01:9000/jdk
下载
hadoop fs -get hdfs://itcast:9000/jdk /home/jdk1.8
测试一个统计动作,wordcount
#hadoop fs -put /root/itcast/hadoop2.7.3/words hdfs://itcast01:9000/words
#hadoop jar hadoop-mapreduce-examples-2.7.3.jar wordcount hdfs://itcast:9000/words hdfs://itcast01:9000/wcount
进web页面可以查看计算结果
1.进入.ssh文件夹
#cd ~
#cd .ssh
#ls -al <--只有一个文件known_hosts(只知道自己)-->
2.生成一对密钥,一个公钥一个私钥,非对称加密
#ssh-keygen -t rsa <-- -t rsa是一种加密方式 -->
三次回车后,ls查看发现生成了两个文件,id_rsa(私钥)和id_tsa.pub(公钥)
3.把公钥拷贝给自己,自己就可以免登陆自己。用cp命令创建一个authorized_keys(文件名不能改)
#cp id_rsa.pub authorized_keys
或者
#ssh-copy-id itcast01
如果要免密码登陆别的机器,就需要将自己的公钥拷贝给对应机器直接使用
#ssh-copy-id 10.31.18.88
测试
#ssh itcast01
可以发现不需要密码就可以登录了
0 0
- CENTOS7搭建伪分布式HADOOP2.7.3
- Hadoop2.7.3伪分布式搭建
- hadoop2.7.3伪分布式搭建
- windows+vmware+centos7+hadoop2.7搭建伪分布式集群
- Centos7+VMware10+Hadoop2.2.0搭建伪分布式服务器
- Hadoop2.7.3伪分布式搭建过程详解
- CentOS7下搭建hadoop2.7.3完全分布式
- hadoop2.4.1伪分布式搭建
- hadoop2.5伪分布式搭建
- hadoop2.6.0伪分布式搭建
- hadoop2.2.0伪分布式搭建
- hadoop2.2.0伪分布式搭建
- hadoop2.4.1伪分布式搭建
- hadoop2.7.1 伪分布式搭建
- hadoop2.4.1伪分布式搭建
- Hadoop2.4.1伪分布式搭建
- hadoop2.6.0 伪分布式搭建
- hadoop2.4.1伪分布式搭建
- 使用hc595驱动双色点阵
- JavaScript
- Mock的好处是什么?
- 关于Android中ListView的addHeaderView()的方法和ListView滑动不流畅的解决方法
- redis专题命令语法介绍之通用KEY
- CENTOS7搭建伪分布式HADOOP2.7.3
- Mosquitto集群搭建
- winform 替换word中指定内容
- Angularjs中使用指令绑定点击事件的方法
- Android ListView不同的item布局实现
- MySql怎样安装(命令安装)
- 动画特效wow.js的用法
- Android 序列化
- 一句话脚本系列之统计文件夹下各种后缀名的文件个数