adoop入门学习笔记

来源:互联网 发布:手机淘宝看退款率 编辑:程序博客网 时间:2024/06/03 17:56

adoop入门学习笔记---par

NameNode:管理集群,并且记录DataNode文件信息;

    SecondaryNameNode:可以做冷备份,对一定范围内的数据作快照性备份;

    DataNode:存储数据;

    JobTracker:管理任务,并将任务分配给taskTracker;

    TaskTracker:任务的执行方。

     HDFS现在都知道是Hadoop分布式文件系统,但是关于它的其它方面比如说它的体系结构就不知道了。因此,还得在此基础上理解Hadoop分布式文件系统的体系结构以及相关基本概念。《Hadoop入门学习笔记---part3》的重点内容就是分布式文件系统和HDFSHDFS的shell操作NameNode体系结构DataNode的体系结构

  1. 分布式文件系统和HDFS:

    DFS(分布式文件系统)是一种允许文件通过网路在多台主机上分享的文件系统。可以让多台机器上的多用户分享文件和存储空间。

            HDFS仅仅是DFS中的一种,适用于一次写入多次查询的情况,不支持并发写的情况,同时也不适合于小文件。

        下面就可以在已经搭建好的hadoop伪分布环境下进行操作了。首先查看hadoop的进程是否已经启动。如果没有启动,需要启动后再进行下面的操作。

      #jps      #start-all.sh   (如果没有启动)
t3

0 0