Ubuntu17.0下安装Hadoop
来源:互联网 发布:云计算产业 编辑:程序博客网 时间:2024/06/06 08:52
一、在Ubuntu下创建hadoop组和hadoop用户
增加hadoop用户组,同时在该组里增加hadoop用户,后续在涉及到hadoop操作时,我们使用该用户。
1、创建hadoop用户组
2、创建hadoop用户
sudo adduser -ingroup hadoop hadoop
回车后会提示输入新的UNIX密码,这是新建用户hadoop的密码,输入回车即可。
如果不输入密码,回车后会重新提示输入密码,即密码不能为空。
最后确认信息是否正确,如果没问题,输入 Y,回车即可。
3、为hadoop用户添加权限
输入:sudo gedit /etc/sudoers
回车,打开sudoers文件
给hadoop用户赋予和root用户同样的权限
二、用新增加的hadoop用户登录Ubuntu系统
三、安装ssh
sudo apt-get install openssh-server
安装完成后,启动服务
sudo /etc/init.d/ssh start
查看服务是否正确启动:ps -e | grep ssh
设置免密码登录,生成私钥和公钥
ssh-keygen -t rsa -P ""
此时会在/home/hadoop/.ssh下生成两个文件:id_rsa和id_rsa.pub,前者为私钥,后者为公钥。
下面我们将公钥追加到authorized_keys中,它用户保存所有允许以当前用户身份登录到ssh客户端用户的公钥内容。
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
登录ssh
ssh localhost
退出
exit
四、安装Java环境
1.首先搭建JAVA环境。
将下载的安装包解压到一个自己指定的目录。 tar -zxvf jdk-8u101-Linux-x64.tar.gz -C ~/software
然后修改环境变量文件 sudo vi /etc/profile
,在末尾添加:
- 1
- 2
- 3
- 4
- 1
- 2
- 3
- 4
保存关闭后,source /etc/profile
,使修改生效。
然后可以验证Java是否生效,java -version
。
五、安装Scala环境
过程跟JAVA差不多。
就是修改profile有点区别:
- 1
- 2
- 1
- 2
然后还是保存关闭后source一下,让它生效。
最后Scala -version
,看看版本。
六、安装hadoop2.7.3
1、官网下载http://mirror.bit.edu.cn/apache/hadoop/common/
2、安装
解压
sudo tar -zxvf hadoop-2.7.3.tar.gz
假如我们要把hadoop安装到/usr/local下
拷贝到/usr/local/下,文件夹为hadoop
sudo mv hadoop-2.4.0 /usr/local/hadoop
赋予用户对该文件夹的读写权限
sudo chmod 774 /usr/local/hadoop
进入hadoop配置目录,~/software/hadoop-2.7.3/etc/hadoop
,在此目录中,我们需要配置几个文件。
- hadoop-env.sh,在里面设置JAVA_HOME。
- 1
- 2
- 1
- 2
- yarn-env.sh,在里面设置JAVA_HOME。
- 1
- 2
- 1
- 2
- slaves,在这个文件里面加入作为slave的IP地址或者对应的hosts映射名字。
- 1
- 2
- 1
- 2
- core-site.xml,右键编辑。注意到底下的目录,如果软件内没有tmp,则自己创建。由于markdown语法问题,以下<符号后边都有一个空格,请自行删除。
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- hdfs-site.xml,右键编辑。注意到底下的目录,如果软件内没有/dfs/name以及/dfs/data,则自己创建。由于markdown语法问题,以下<符号后边都有一个空格,请自行删除。
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- mapred-site.xml,右键编辑。由于markdown语法问题,以下<符号后边都有一个空格,请自行删除。
- 1
- 2
- 3
- 4
- 5
- 6
- 1
- 2
- 3
- 4
- 5
- 6
- yarn-site.xml,右键编辑。由于markdown语法问题,以下<符号后边都有一个空格,请自行删除。
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
3 . 最后就可以将配置好的hadoop-2.7.3文件夹分发给所有slave了。
- 1
- 2
- 1
- 2
4 . 启动hadoop。cd到hadoop主目录。然后先格式化namenode,然后再启动。
- 1
- 2
- 1
- 2
5 . 用jps命令查看hadoop进程。
在master上应该有:
- 1
- 2
- 3
- 4
- 1
- 2
- 3
- 4
在slave1与slave2上应该有:
- 1
- 2
- 3
- 1
- 2
- 3
并且,在master节点,浏览器输入 master:8088 能够访问hadoop管理界面,并看到slaves的存在。
安装Spark
1 . 解压已经下载的Spark到到~/software/
目录。
2 . 进入到Spark配置目录,~/software/spark-2.0.0-bin-hadoop2.7/conf
,在此目录下,可以看到很多配置文件。但是很多文件都是以template结尾的,这是因为spark给我们提供的模板配置文件,我们可以拷贝一份,然后将.template
给去掉,变成真正的配置文件后再编辑。
- spark-env.sh,这个文件里可以配置各种spark的运行环境。我们配置几个基本的,可以根据自己机器的实际情况进行配置。添加一下代码到末尾。
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- slaves,在这个文件里把slaves的hosts里的映射名添加进去。
- 1
- 2
- 1
- 2
3 . 最后就可以将配置好的spark-2.0.0-bin-hadoop2.7文件夹分发给所有slave了。
- 1
- 2
- 1
- 2
4 . 启动Spark,cd到spark主目录,然后sbin/start-all.sh
。
5 . 如果启动成功,那么用jps命令可以看到:
在master节点上有7805 Master
进程,
在slaves有3759 Worker
进程。
同样的,在master节点,浏览器输入 master:8080 能够访问spark管理界面,并看到slaves的存在。
- Ubuntu17.0下安装Hadoop
- VMware12.0下安装配置Ubuntu17.04
- ubuntu17下安装pgAdmin4
- ubuntu17.04下安装LNMP
- ubuntu17.04下mysql5.7.18源码安装
- Ubuntu17.04下安装vmware虚拟机
- ubuntu17.04下 selenium安装及使用
- Ubuntu17+下安装Mysql5.7+配置字符集
- Windowns、Ubuntu17.10 下安装 MongoDB
- Ubuntu17.04下安装OpenCV3.2.0
- Ubuntu17.04下安装部署DPDK17.11
- Hive1.2.2安装步骤(Ubuntu17.04环境下搭建)
- 在ubuntu17.04下安装网易云音乐出错
- Windows10下安装Ubuntu17.04双系统(无图)
- Ubuntu17.04双系统的安装笔记(win7下)
- ubuntu17.04下安装开源入侵检测工具snort
- 在ubuntu17.04下安装最新版QQ教程
- Ubuntu17.10下安装和编译caffe问题总结
- CC3220学习笔记---UART的使用(翻译)
- vxworks 内核 shell 用法详解
- angularde directive
- java删除文件
- c#:未将对象引用设置到对象的实例--可能出现的问题总结(转)
- Ubuntu17.0下安装Hadoop
- MyBatis学习总结(四)——解决字段名与实体类属性名不相同的冲突
- Android开发架构的一些思考
- 进程间通信之--匿名管道
- alphalens教程1--整理好你的数据
- 64位Mex文件在Matlab 2014b和Visual Studio 2013中的调试
- static方法能否被重写
- bootstrap中datetimepicker日期控件的使用
- MyBatis学习总结(五)——实现关联表查询