hadoop 学习笔记 一

来源:互联网 发布:软件项目推广方案 编辑:程序博客网 时间:2024/05/19 03:26

1.hadoop的核心:提供了一个共享存储系统HDFS和一个分析处理系统MapReduce。


2.

3.jobtracker用于跟踪MapReduce作业


4.hdfs 分布式文件系统,运行与大型商用机集群


5.pig 一种数据语言和运行环境,用于检索非常大的数据集。pig运行在MapReduce和HDFS的集群上


6.hive 一个分布式、按列存储的数据库仓库。hive管理HDFS中存储的数据,并提供基于SQL的查询语言用以查询数据


7.hbase 一个分布式、按列存储数据库。hbase使用HDFS作为底层存储,同时支持MapReduce的批量式计算和点查询(随机读取)


8.zookeeper 一个分布式、可用性高的协调服务。提供分布式锁之类的基本服务用于构建分布式应用


9.sqoop 在数据库和HDFS之间高效传输数据的工具


原创粉丝点击