Hadoop简介

来源:互联网 发布:江南大学网络教育网站 编辑:程序博客网 时间:2024/06/11 13:07
Hadoop起源于2002年的Apache Nutch项目,是Apache Lucene的子项目之一。2004年,Google在OSDI上公开发表了题为《MapReduce: Simplified Data Processing on Large Clusters》的论文,受到启发的Doug Cutting等人开始实现MapReduce计算框架并与NDFS(Nutch Distributed File System)结合支持Nutch的主要算法。2006年逐渐成为一套完整而独立的软件,起名为Hadoop。

2008年初,Hadoop成为Apache顶级项目。也是在这一年,首届中国大数据技术大会在北京举行。过去六年,Hadoop从名不见经传的菜鸟,一跃成为大数据领域的黄色大象。