Hadoop之伪分布式
来源:互联网 发布:java获取当前目录 编辑:程序博客网 时间:2024/05/20 17:41
三种受支持模式启动Hadoop集群:
- 本地(独立)模式
- 伪分布式模式
- 完全分布式模式
本地(独立)模式:
默认情况下,Hadoop被配置为以非分布模式运行,作为单个Java进程。这对调试很有用。
以下示例将解压缩的配置目录复制为输入,然后查找并显示给定正则表达式的每个匹配项。输出写入给定的输出目录。
$ mkdir input $ cp etc/hadoop/*.xml input $ bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.4.jar grep input output 'dfs[a-z.]+' $ cat output/*
伪分布式模式 :
Hadoop也可以在伪分布模式下的单节点上运行,其中每个Hadoop守护进程都在单独的Java进程中运行。
配置如下:
1.配置一个HDFS文件系统:
vi etc/hadoop/core-site.xml
新增HDFS文件系统节点:
<configuration> <property> <name>fs.defaultFS</name> <value>hdfs://localhost:9000</value> </property></configuration>
2 .指定副本节点数量
vi etc/hdfs-site.xml
新增
<configuration> <property> <name>dfs.replication</name> <value>1</value> </property></configuration>
3.配置ssh无秘钥登录
现在检查你是否可以不用密码ssh到本地主机:
$ ssh localhsot
如果您不能在没有密码的情况下ssh到本地主机,请执行以下命令:
$ ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa $ cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys $ chmod 0600 ~/.ssh/authorized_keys
以下说明是在本地运行MapReduce作业。
1.格式化文件系统:
$ bin/hdfs namenode -format
2.启动NameNode守护进程和DataNode守护进程:
$ sbin/start-dfs.sh
查看服务是否启动正常
$ jps
如果看到NameNode,DataNode,SecondaryNameNode等进程,则表示启动正常。
如果启动失败,可以查看相关的日志文件。Hadoop日志默认在Hadoop目录下的logs文件夹下。
$ cd logs
3.浏览NameNode的Web界面
http://localhost:50070/
4.创建执行MapReduce作业所需的HDFS目录:
$ bin/hdfs dfs -mkdir /user $ bin/hdfs dfs -mkdir /user/<username>
username本人写的root。
5.将输入文件复制到分布式文件系统中:
$ bin/hdfs dfs -put etc/hadoop /user/root/input
上传到HDFS的/user/root/input目录下。
6.运行一些提供的例子:
$ bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.4.jar grep /user/root/input /user/root/output 'dfs[a-z.]+'
7.检查输出文件:将输出文件从分布式文件系统复制到本地文件系统并检查它们:
$ bin/hdfs dfs -get /user/root/output output $ cat output/*
或者查看分布式文件系统上的输出文件:
$ bin/hdfs dfs -cat /user/root/output/*
8.测试完毕后,停止守护进程:
$ sbin/stop-dfs.sh
阅读全文
0 0
- hadoop之伪分布式
- Hadoop之伪分布式
- Hadoop之伪分布式配置
- hadoop之伪分布式模式
- hadoop实例之伪分布式模式
- hadoop实战之伪分布式模式
- hadoop之单机伪分布式环境搭建
- Hadoop简单入门之伪分布式搭建
- Hadoop伪分布式环境部署之Hive
- hadoop之docker伪分布式部署
- 【Hadoop学习】之 伪分布式安装
- 【hadoop之翊】——伪分布式的hadoop配置
- Hadoop学习笔记之Hadoop伪分布式环境搭建
- 【Hadoop基础教程】3、Hadoop之伪分布式环境搭建
- Hadoop学习之二《Hadoop环境伪分布式环境搭建》
- Hadoop入门之Hadoop伪分布式环境搭建
- Hadoop入门基础教程 Hadoop之伪分布式环境搭建
- hadoop伪分布式部署
- 使用SurfaceView+MediaPlayer视频播放
- windows 下点加斜杠的路径表示
- 详解CSS display:inline-block的应用
- 数据访问层:分库分表与读写分离
- linux配置静态ip访问外网
- Hadoop之伪分布式
- Ionic 环境搭建(ios创建环境运行)
- 标准Web系统的架构分层
- HTTP协议浅析(上):简介
- 系统优化工具 Wise Care 365 Pro官方注册版V4.76下载 | 含wise care 365 pro 注册码
- 数据结构-链表排序总结
- 【机房重构】--七层总结
- linux常用命令总结
- 微信小程序(一)-文件结构