Alluxio使用场景
来源:互联网 发布:入门鼠标推荐 知乎 编辑:程序博客网 时间:2024/06/05 04:55
官网:http://www.alluxio.org
在Alluxio上运行spark :http://www.alluxio.org/docs/1.6/cn/Running-Spark-on-Alluxio.html#规避-为hadoop配置指定fsalluxioimpl
Alluxio作为一个内存级的虚拟分布式存储系统有几个常见的使用场景:
- 计算层需要反复访问远程(比如在云端,或跨机房)的数据;
- 计算层需要同时访问多个独立的持久化数据源(比如同时访问S3和HDFS中的数据);
- 多个独立的大数据应用(比如不同的Spark Job)需要高速有效的共享数据;
- 当计算层有着较为严重的内存资源、以及JVM GC压力,或者较高的任务失败率时,Alluxio作为输入输出数据的Off heap存储可以极大缓解这一压力,并使计算消耗的时间和资源更可控可预测。
详见:http://blog.csdn.net/alluxio/article/details/59536999
特点:多个Spark job以内存级速度共享相同的数据(可以做到多个job共享一个RDD)
阅读全文
0 0
- Alluxio使用场景
- alluxio的适用场景
- alluxio
- Alluxio
- 使用Alluxio优化Spark RDD
- 快速开始使用Spark和Alluxio
- 使用Alluxio高效存储Spark RDD
- [场景] -- 场景使用
- Spark+Alluxio的使用初级(转自官网)
- 分布式内存文件系统alluxio的安装,底层存储使用hdfs
- 使用Alluxio提升HDFS集群的性能和SLA稳定性
- 使用Alluxio(前Tachyon)来加速大数据计算
- 使用Alluxio加速基于Ceph对象存储的数据分析
- 使用场景
- 使用场景
- Alluxio简介
- Spark & Alluxio
- Alluxio简介
- hadoop-企业版环境搭建(四)-安装HBase
- C++一本通题库1017
- C++ 函数参数传递
- Hdu 3938 Portal【离线+并查集+思维】
- C++一本通题库1018
- Alluxio使用场景
- 斐波那契数列变形之青蛙跳台阶
- 【Linux】软件安装
- HTML5 Storage JSON
- C
- IDEA构建Hive的UDF函数
- Java网络编程之NIO(ServerSocketChannel/SocketChannel)-yellowcong
- 设计模式之装饰者模式
- 教育思想研究----爱因斯坦论教育