Hadoop源代码研读之路(1)

来源:互联网 发布:交叉验证的目的 知乎 编辑:程序博客网 时间:2024/05/19 12:12

首先,阅读过此文的朋友,希望你们能留下宝贵的意见。

此背景以hadoop-0.20.2为基础

解压完之后如下:

/bin:包含一些集群的命令

/C++:应该是在hadoop上用C++开发的接口

/conf:hadoop的配置文件

/contrib:一些插件

/docs:说明文档

/ivy:不知道什么意思

/lib:一些架包

/librecordio:也不知道什么意思

/src:hadoop中的部分源码

/webapps:hadoop中一些web应用(比如HDFS的监控和管理)

在hadoop-0.20.2-core.jar中主要包含下面几个包

org.apache.hadoop

org.apache.hadoop.filecache

org.apache.hadoop.conf

org.apache.hadoop.fs

org.apache.hadoop.hdfs

org.apache.hadoop.http

org.apache.hadoop.ipc

org.apache.hadoop.log

org.apache.hadoop.io

org.apache.hadoop.mapred

org.apache.hadoop.mapreduce

org.apache.hadoop.security

org.apache.hadoop.util

org.apache.hadoop.net

org.apache.hadoop.reeord

org.apache.hadoop.metrics

还有一些配置文件,红色的是我们主要了解。