HaLoop
来源:互联网 发布:唱歌学英语软件 编辑:程序博客网 时间:2024/06/06 04:18
Hadoop的成功,让人们看到了使用普通商业集群处理大规模数据的合理性和必要性。
但是,目前在使用Hadoop处理数据的过程中,发现一些应用在处理迭代计算的过程中,例如机器学习、数据挖掘、网页排名等应用的过程中,Hadoop的MR框架有一定的不足。
不足主要存在于:
hadoop的中间数据要存储在本地磁盘,我们迭代的时候,存在本地磁盘的数据并没有变化,只是I/O,频繁的I/O降低了系统的性能。
在需求的驱动下,HaLoop提出了:
1 扩展mapreduce,支持迭代计算的编程模型。
2 使得任务调度对于跌倒操作敏感。
3 将loop-invariant data放在reduce节点的cache上,提升性能。
HaLoop的arch:
一个master node,多个slave nodes。
jobs通过不同的clients发送到master节点,master节点控制作业的执行、调度,并把作业转换成在各个slave节点上执行的并行或者序列化的任务。
HaLoop的最大的特点是:Loop-Aware task scheduleing
但是,目前在使用Hadoop处理数据的过程中,发现一些应用在处理迭代计算的过程中,例如机器学习、数据挖掘、网页排名等应用的过程中,Hadoop的MR框架有一定的不足。
不足主要存在于:
hadoop的中间数据要存储在本地磁盘,我们迭代的时候,存在本地磁盘的数据并没有变化,只是I/O,频繁的I/O降低了系统的性能。
在需求的驱动下,HaLoop提出了:
1 扩展mapreduce,支持迭代计算的编程模型。
2 使得任务调度对于跌倒操作敏感。
3 将loop-invariant data放在reduce节点的cache上,提升性能。
HaLoop的arch:
一个master node,多个slave nodes。
jobs通过不同的clients发送到master节点,master节点控制作业的执行、调度,并把作业转换成在各个slave节点上执行的并行或者序列化的任务。
HaLoop的最大的特点是:Loop-Aware task scheduleing
- HaLoop
- Haloop介绍
- HaLoop——适用于迭代计算的Hadoop
- HaLoop—适用于迭代计算的Hadoop
- HaLoop——适用于迭代计算的Hadoop
- HaLoop:大集群上高效的迭代数据处理(上)
- HaLoop:大集群上高效的迭代数据处理(下)
- vs2008如何新建自己工程的环境变量(局部)和 Windows系统(全局)
- Bump Mapping
- 泛型集合List<T>
- OSCache简单应用
- 读书
- HaLoop
- HDU 1007 Quoit Design(计算几何 平面最近点对)
- 用windows远程连接linux桌面(使用tightvnc或者tigervnc)
- 万用表测量二极管
- 面试题:求二叉树中节点的最大距离
- POJ 1046 Color Me Less(浅水)
- 聊天室是一种典型的网络应用,这个程序演示了ICE框架的基本结构。
- 求序列逆序数
- Linux 防火墙