关系型数据库管理系统跟Hadoop比较
来源:互联网 发布:加入snh48好吗 知乎 编辑:程序博客网 时间:2024/06/05 04:28
1.问题:
为什么不能配有大量硬盘的数据库来进行大规模的数据分析?我们为什么需要hadoop?
2.说明:
这两个问题的答案来自计算机硬盘的另一个发展趋势:寻址的时间提升远远不敌于传输速率的提升。寻址是将磁头移动到特定的硬盘位置进行读/写的过程。
它是导致硬盘操作延迟的主要原因,而传输速率取决于硬盘的宽带。
如果数据访问中含有大量的硬盘寻址,那么读取大量数据集就必然花费更长的时间(相对于;流数据读取模式,流读取主要取决于传输速率)。另一方面,如果数据库系统只是更新一小部分记录,那么传统的B树(关系数据库中的使用的一种数据结构,受限于寻址的速率)就更有优势。但如果数据库系统有大量的数据更新,B树的效率就更明显落后于MapReduce,因为它需要使用”排序||合并”(sort/merge)来重建数据库。
在许多情况下,可以将MapReduce视为关系数据库管理系统的补充。两个系统之间的差异如下图所示:
MapReduce比较适合解决需要以批处理方式分析整个数据集的问题,尤其是一些特定目的的分析。RDBMS适用于索引后数据集的点查询和更新,建立索引的数据库系统能够提供对小规模数据的低延迟数据检索和快速更新。MapReduce适合一次写入,多次读取数据的应用,关系数据库则更合适持续更新的数据集。
阅读全文
0 0
- 关系型数据库管理系统跟Hadoop比较
- 关系型数据库管理系统比较
- 关系型数据库管理系统
- 关系型数据库管理系统
- 关系型数据库与数据库管理系统
- 毕业设计之外文翻译---SQLite vs MySQL vs PostgreSQL:关系型数据库管理系统的比较
- 数据库管理系统比较
- 关系型数据库和关系型数据库管理系统
- 1.关系型数据库管理系统简介
- 【SQLite关系型数据库管理系统】开篇
- Java 关系型数据库管理系统简介
- 什么是关系型数据库管理系统
- 关系型数据库管理系统简介
- 关系型数据库管理系统简介
- 关系型数据库管理系统简介
- 关系型数据库管理系统简介
- 关系型数据库管理系统简介
- 关系型数据库管理系统简介
- IO-打印流
- java程序中出现Link all references for a local rename (does not change references in other files)
- 剑指offer(20)—包含min函数的栈
- 使用caffe训练一个多标签分类/回归模型
- OKHttp源码解析一(网络请求篇)
- 关系型数据库管理系统跟Hadoop比较
- IDEA添加JSTL标签报错解决措施
- UVA 10385(101/600)
- kafka web console监控软件的安装
- ARP监测工具Arpwatch
- Java CAS原理深度分析
- document.body.clientHeight 和 document.documentElement.clientHeight 的区别
- Assimp配置
- socket服务器和客户端的建立步骤。Python实现