Hadoop 笔记(一)

来源:互联网 发布:淘宝网怎么实名认证 编辑:程序博客网 时间:2024/05/29 09:42
 

Hadoop是一个基于Java的分布式密集数据处理和数据分析的软件框架。Hadoop在很大程度上是受Google在2004年白皮书中阐述的MapReduce的技术启发。MapReduce工作原理是将任务分解为成百上千块的小任务,然后发送到计算机集群中。每台计算机再传送会自己那部分信息,MapReduce则迅速整合这些反馈并形成答案。

 

Hadoop的商业价值:

1.高容量低成本的组合:可处理分布在数以千计的低成本X86服务器计算节点中的大型数据。

2.具有处理混合数据类型的能力:Hadoop可以管理结构化数据,以及诸如服务器日志文件和Web点击流的数据。同时还可以管理以非结构化文本为中心的数据,如Facebook和Twitter。

 

转载文章:http://cloud.csdn.net/a/20111114/307437.html

原创粉丝点击