hadoop之hdfs基本原理(二)
来源:互联网 发布:淘宝361官方旗舰店 编辑:程序博客网 时间:2024/06/03 14:41
一 HDFS基本概念
hdfs文件被分成块进行存储,默认64M,块是文件存储处理的逻辑单元
hdfs有两个节点,NameNode和DataNode
NameNode存放文件元数据:分别是文件与数据块的映射表,数据块与数据节点的映射表。配置副本策略和处理客户端请求
DataNode:实际存储数据、执行数据块的读写并汇报存储信息给NameNode;一般默认每个数据块有三个副本,保存在两个机架上面,保证hdfs的高可用
另外还有个Secondary NameNode:辅助NameNode,分担NameNode工作,定期合并fsimage和fsedits并推送给NameNode,紧急情况下可辅助恢复NameNode;其实就是NameNode的备胎,保证NameNode的高可用性
心跳检测:每隔多少秒钟,dataNode会向NameNode报自己的工作状况,是不是还处于active状态
hdfs读取文件
hdfs写入文件
hdfs和传统文件系统有什么区别:
1.数据冗余,硬件容错
2.流式数据访问,一次写入,多次读取,块没法修改
3.存储大文件,如果是大量的小文件对NameNode压力很大,所以不像数据库那样适合频繁的交互式引用;一次写入,多次读取,顺序读写;不支持多用户并发写相同文件
二 hdfs使用
hdfs提供了shell接口,可以直接执行一些类似的linux命令
在hadoop-1.2.1/conf目录下
创建文件夹
,创建的文件夹默认在hdfs /user/root 目录下
hadoop fs -mkdir input
查看一下:hadoop fs -ls /user/root
将一个文件上传到hdfs我们刚刚创建的input文件夹中中:
hadoop fs -put hadoop-env.sh /input
查看一下:
hadoop fs -ls /user/root/input
下载hdfs文件到本地:
hadoop fs -get input/hadoop-env.sh hadoop-env2.sh
查看一下本地:
ls
查看文件系统的所有信息:
hadoop dfsadmin -report
- hadoop之hdfs基本原理(二)
- Hadoop之HDFS(二)
- Hadoop介绍(二) HDFS
- Hadoop集群之HDFS伪分布式安装 HA(二)
- Hadoop之HDFS的操作命令(二)
- hadoop入门九(HDFS基本原理和操作)
- hadoop入门十(HDFS基本原理和操作)
- hadoop入门十一(HDFS基本原理和操作)
- 学习Hadoop第六课(初识HDFS的基本原理)
- Hadoop学习之HDFS架构(二)
- Hadoop学习之HDFS架构(二)
- 大数据学习篇:hadoop深入浅出系列之HDFS(二)——HDFS体系结构
- Hadoop HDFS源码学习笔记(二)
- Hadoop自学笔记(二)HDFS简介
- 理解Hadoop分布式文件系统HDFS(二)
- 从零开始学Hadoop----浅析HDFS(二)
- Hadoop-HDFS(二)写流程
- Hadoop学习笔记(二)HDFS
- 动态规划算法--解最长公共子序列问题
- js 正则表达式入门到“能干活”
- pyqt自定义信号与槽
- Java基础知识02-流程控制-swith
- GDB调试命令~
- hadoop之hdfs基本原理(二)
- Web应用中实现页面加载提示
- [后缀自动机][单调队列优化DP] BZOJ 2806: [Ctsc2012]Cheat
- 数据挖掘与知识发现课后习题答案
- Verilog入门笔记
- mysql开启远程后还无法连接
- 【CodeForces-617E】XOR and Favorite Number 莫队(好玩题)
- 2017年浙江工业大学大学生程序设计迎新赛决赛—网络同步赛 E 栗酱的数列【差分+KMP】
- 【HTML5 canvas】关于canvas标签的理解和简单应用