程序博客网 > 中世纪2优化9兵种

大数据学习2——大数据处理架构Hadoop概述

来源：互联网发布：中世纪2优化9兵种编辑：程序博客网时间：2024/06/05 00:42

一、Hadoop简介（转自百度百科）

Hadoop是Apache基金会所开发的分布式系统基础架构。

用户可以在不了解分布式底层细节的情况下，开发分布式程序。充分利用集群的威力进行高速运算和存储。

Hadoop实现了一个分布式文件系统（Hadoop Distributed File System），简称HDFS。HDFS有高容错性的特点，并且设计用来部署在低廉的硬件上；而且它提供高吞吐量来访问应用程序的数据，适合那些有着超大数据集的应用程序。HDFS放宽了POSIX的要求，可以以流的形式访问文件系统中的数据。

Hadoop的框架最核心的设计就是：HDFS和MapReduce。HDFS为海量的数据提供了存储，则MapReduce为海量的数据提供了计算。

二、Hadoop项目结构

HDFS：负责整个分布式文件的存储。

YARN：负责资源的管理和调度。

MapReduce：离线批处理，无法实现实时计算。

Tez：分析优化MapReduce作业，形成有向无环图。

Spark：逻辑与MapReduce类似，与MapReduce的区别是：Spark是基于内存的计算，MapReduce是基于磁盘的计算。

Hive：批量数据处理，实现数据仓库的功能。

Pig：流数据处理，轻量级的脚本语言。

Oozie：作业流调度系统，工作流管理工具。

Zookeeper：提供分布式协调服务，做分布式锁、集群管理等。

HBase：分布式数据库，支持随机读写和实时应用。

Flume：一个高可靠的、高可用的分布式海量日志采集、聚合和传输的系统。

Sqoop：用于Hadoop与传统数据库之间进行数据传输。

Ambari：Hadoop快速部署工具，支持Apache Hadoop集群的供应、管理和监控。

阅读全文

0 0

中世纪2优化9兵种

中世纪2优化9兵种

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子阴道流水有异味是怎么回事下面一直流水为什么下身老是出水下面为什么会湿下面出水下面有水为什么下面会湿下边老湿怎么办流水样白带是怎么回事怀孕初期下面流水个人贷款银行流水耳朵为什么会流水为什么耳朵会流水为什么下面会流水为什么下面老是流水流汗吧健身少年流汗睡觉流汗汗流满面流汗图片吃饭流汗厉害怎么回事月子流汗能将寒气逼出吗流汗的好处汗流夹背战士站岗流汗容易流汗手脚流汗很厉害怎么办手流汗很厉害怎么办一定要流汗才能减肥吗流汗腋下异味怎么办流汗表情流汗的图片流汗英文男人拼搏流汗的图片流汗表情是什么意思一直流汗出汗黑人兄弟疯狂流汗黑人兄弟疯狂流汗那一集流沙流沙河