笔记:Hadoop权威指南 第1章 初识Hadoop

来源:互联网 发布:八陆融通网络贷款 编辑:程序博客网 时间:2024/06/05 04:07

大数据处理遇到问题:

(1)、磁盘存储容量快速增加,但是访问速度进步不大;用户乐意使用磁盘共享访问。

(2)、硬件故障,可以使用备份解决。

(3)、分布式系统,需要可靠性。


关系数据库与MapReduce比较:

(1)、磁盘寻址时间提高远低于传输速率;流式读取取决于传输速率;在数据库更新大部分数据时候,B树的效率远低于MapReduce。

(2)、半结构化数据、非结构化数据,MapReduce更有效。



0 0
原创粉丝点击