Hadoop学习(1):关键技术概要
来源:互联网 发布:淘宝妹子爱吃的零食 编辑:程序博客网 时间:2024/05/16 05:30
起源
原因:数据量越来越大
启发:Google公司发布大数据技术,包含MapReduce、BigTable、GFS,优点在于
不用去花费大的成本买高配机;
硬件故障变成常态,通过软件保证可靠性;
简化并行分布式计算,无需控制节点同步和数据交换。
但是Google并没有进行开源,所以就有了模仿Google大数据技术的Hadoop。
关键字
Hadoop主要包含以下关键技术
HDFS:分布式文件系统
Hadoop分布式文件系统(HDFS)被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统。它和现有的分布式文件系统有很多共同点。但同时,它和其他的分布式文件系统的区别也是很明显的。HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。HDFS放宽了一部分POSIX约束,来实现流式读取文件系统数据的目的。HDFS在最开始是作为Apache Nutch搜索引擎项目的基础架构而开发的。HDFS是Apache Hadoop Core项目的一部分。这个项目的地址是http://hadoop.apache.org/core/。
MapReduce:框架
Hadoop Map/Reduce是一个使用简易的软件框架,基于它写出来的应用程序能够运行在由上千个商用机器组成的大型集群上,并以一种可靠容错的方式并行处理上T级别的数据集。
Hadoop家族产品
Hadoop的业务处理和其他工具
0 0
- Hadoop学习(1):关键技术概要
- 操作系统学习概要(1)
- Hadoop之关键技术(二)--- MapReduce
- Hadoop之关键技术(三)--HBase
- Hadoop之关键技术(四)--Zookeeper
- Hadoop FileSystem文件系统的概要学习
- AlphaGo关键技术,Deep Learning(深度学习)<1>
- Integration Services 学习(1):概要
- SSIS 学习(1) 概要
- SSIS 学习(1) 概要
- 红黑树 学习概要(1)
- Hadoop关键技术理解
- CDN学习(三) -- CDN四大关键技术
- 学习1--Cocos2d-x概要
- 概要学习规划 (Android)
- Hadoop之关键技术(一)----HDFS
- Hadoop生态圈概要
- hadoop部署概要
- Java值得注意的知识点
- ArchLinux必备命令记录
- 使用wsimport生成webservices客户端代码
- 全屏/非全屏切换
- Liunx(一场不可思议的旅行作业)
- Hadoop学习(1):关键技术概要
- LintCode二叉树&递归分治题总结
- Mesos源码分析(8): Mesos-Slave的初始化
- Session解析及运行
- 网络
- Hadoop学习(2):HDFS基础
- 数据类型的取值范围
- QT 的信号与槽机制介绍
- Leetcode : Gray Code