HADOOP 初见

来源:互联网 发布:au2018破解版 mac 编辑:程序博客网 时间:2024/05/20 18:41


   

Hadoop本身提供了丰富的tool(一大堆脚本工具)
而且还可以继承这些tool做更强大的开发

Hadoop还为javaTM提供了很多本地方法库(基于JNI)弥补JAVA的局限

Hadoop还有很多子项目(如HIVE,HBASE,SQOOP),以及很多免费的基于hadoop开发的工具项目



其中用来做数据库集群的是HBASE   他的管理工具(类似于关系映射工具)HIVE
为了让“旧的数据库表”导入HBASE,还提供了sqoop工具 


子项目
Hadoop Common: 在0.20及以前的版本中,包含HDFS、MapReduce和其他项目公共内容,从0.21开始HDFS和MapReduce被分离为独立的子项目,其余内容为Hadoop Common
HDFS: Hadoop分布式文件系统(Distributed File System) - HDFS (Hadoop Distributed File System)
MapReduce:并行计算框架,0.20前使用 org.apache.hadoop.mapred 旧接口,0.20版本开始引入org.apache.hadoop.mapreduce的新API
HBase: 类似Google BigTable的分布式NoSQL列数据库。(HBase和Avro已经于2010年5月成为顶级 Apache 项目)
Hive:数据仓库工具,由Facebook贡献。
Zookeeper:分布式锁设施,提供类似Google Chubby的功能,由Facebook贡献。
Avro:新的数据序列化格式与传输工具,将逐步取代Hadoop原有的IPC机制。
Pig: 大数据分析平台,为用户提供多种接口。
Ambari:Hadoop管理工具,可以快捷的监控、部署、管理集群。
Sqoop:于在HADOOP与传统的数据库间进行数据的传递。


0 0
原创粉丝点击