/**一：初识Hadoop*/

来源：互联网发布：python实例100例编辑：程序博客网时间：2024/06/07 00:05

1.1 Hadoop核心价值

1.2 与关系型数据库管理系统的比较

传统的关系型数据库 MapReduce 数据大小 GB PB 数据存取交互式和批处理批处理更新多次读/写一次写入，多次读取结构静态模式动态模式完整性高低横向扩展非线性的线性的

1.3 术语

Namenode:
1.1）HDFS采用master/salve架构；
1.2）一个HDFS集群是由一个Namenode和一定数目的Datanodes组成；
1.3）Namenode是一个中心服务器，负责管理文件系统的名字空间（namespace）以及客户端对文件的访问；
1.4）Namenode执行文件系统的名字空间操作，如打开、关闭、重命名文件或目录；
1.5）负责确定数据块到具体Datenode节点的映射；
Datanode
2.1）一般一个节点一个Datanode，负责管理他所在节点上的存储；
2.2）一个文件其实被分成一个或多个数据块，存储在一组Datanode上；
2.3） Datanode负责处理文件系统客户端读写请求；
2.4）在Namenode的统一调度下进行数据块的创建、删除和复制；
Secondnamenode：
3.1）一般一个节点一个Datanode，负责管理他所在节点上的存储；
3.2）一个文件其实被分成一个或多个数据块，存储在一组Datanode上；
3.3） Datanode负责处理文件系统客户端读写请求；
3.4）在Namenode的统一调度下进行数据块的创建、删除和复制；
Jobtracker和Tasktracher：
4.1）所有的job的执行都由Jobtracker来调度；
4.2） Hadoop系统中只配置一个JobTracker应用；
4.3）TaskTracker都需要运行在HDFS的DataNode上；

1 0