hadoop学习

来源:互联网 发布:淘宝搜索排行 编辑:程序博客网 时间:2024/06/06 04:54
HDFS:分布式文件系统
    NameNode:属于管理层,用于管理数据的存储。
    SecondaryNameNode:也属于管理层,辅助NameNode进行管理。
    DataNodes:属于应用层,用户进行数据的存储,被NameNode进行管理,要定时的向NameNode进行工作汇报,执行NameNode分配分发的任务。
MapReduce:分布式的并行计算框架
    JobTracker:属于管理层,管理集群资源和对任务进行资源调度,监控任务的执行。
    TaskTracker:属于应用层,执行JobTracker分配分发的任务,并向JobTracker汇报工作情况


Apache Hadoop 守护进程作用
NameNode是主节点,存储文件的元数据如文件名,文件目录结构,文件属性(生成时间,副本数,文件权限),以及每个文件的块列表和块所在的DataNode等。
DateNode 在本地文件系统存储文件块数据,以及块数据的校验和。
Secondary NameNode 用来监控HDFS状态的辅助后台程序,每隔一段时间获取HDFS元数据的快照。
JobTracker负责接收用户提交的作业,负责启动、跟踪任务执行。
TaskTracke负责执行由JobTracker分配的任务,管理各个任务在每个节点上的执行情况。
0 0
原创粉丝点击