hadoop 之旅 - 序言

来源:互联网 发布:查看进程占用端口 编辑:程序博客网 时间:2024/05/06 23:36

公司的桌上有两本书,分别是中文版和英文版的 hadoop 权威指南

本就英语有点渣的我应该不会犹豫的去选择中文版的那本研读一番,最后却倔强的选择了英文原版的。过去了两天的时间(工作之余)刚刚硬着头皮读完序言部分。

马上进入正文阅读,特立次博客警示自己坚持看完,哪怕耗费十倍的时间,否则自己就会永远的卡在了英语这一关上


一. 序言简单分析

1. hadoop 内部机制很复杂 -- 它是 分布式系统理论(distributed system theory),实际工程(practical engineering),常识(common sense) 的混合产物

2. hadoop 的核心(core)--  hadoop 为分布式系统提供的工具 【包括 数据存储(data storage)、数据分析(data analysis)、协作(coordination)】很简单

3. hadoop 是一个更高层次的抽象 -- 为了帮助那些恰好有大量数据存储,有大量数据分析,有许多机器进行协作,却没有时间,没有技术,没有想成为分布式系统专家倾向的人

4. 早期(2006)hadoop 的安装(setting up)、配置(configuring)、程序编写 是一种艺术(难度大啊)

5. 随着更多的文档,更多的示例,更多的邮件列表帮助我们解答各种问题,hadoop 的门槛已经降低了

6. Apache hadoop community 有了很大进步,并且产生了 6 个子项目 (spun off half a dozen subprojects), 在性能(performance),可靠性(reliability),稳定性(scalability),可管理性(manageability)方面取得了跳跃式的发展

7. 为了使得 hadoop 更广泛的被采用(adoption) ,我认为我们应该使得 hadoop 更加容易使用 -- 包括开发更多工具、集成到更多的系统中去、开发更新更好的 API


Administrative Notes(管理人笔记)


What's in this Book 


Acknowledgments(谢鸣)

0 0
原创粉丝点击