SparkRDD缓存策略
来源:互联网 发布:gnu与linux 编辑:程序博客网 时间:2024/06/06 01:12
StorageLevel关键属性
原则 可以使用内存 就不要使用磁盘了
将RDD 作为反序列化的的对象存储JVM 中。如果RDD不能被内存装下,一些分区将不会被缓存,并且在需要的时候被重新计算。
这是是默认的级别
MEMORY_AND_DISK将RDD 作为反序列化的的对象存储在JVM 中。如果RDD不能被与内存装下,超出的分区将被保存在硬盘上,并且在需要时被读取MEMORY_ONLY_SER将RDD 作为序列化的的对象进行存储(每一分区占用一个字节数组)。
通常来说,这比将对象反序列化的空间利用率更高,尤其当使用fast serializer,但在读取时会比较占用CPU
MEMORY_AND_DISK_SER与MEMORY_ONLY_SER 相似,但是把超出内存的分区将存储在硬盘上而不是在每次需要的时候重新计算DISK_ONLY只将RDD 分区存储在硬盘上DISK_ONLY_2等带2的与上述的存储级别一样,但是将每一个分区都复制到两个集群结点上 0 0
- SparkRDD缓存策略
- sparkRDD
- 缓存策略;
- 缓存策略
- 缓存策略
- 缓存策略
- sparkRDD操作
- 缓存系列--缓存策略
- 缓存Memcached以及缓存策略
- 缓存Memcached以及缓存策略
- 缓存Memcached以及缓存策略
- 缓存Memcached以及缓存策略
- 缓存策略的改动
- 页面缓存策略
- Ehcache缓存回收策略
- squid缓存策略
- 双存储缓存策略
- Cache4J--缓存策略
- 07 初始化时钟
- 设计中各单位的转换px、pt、ppi、dpi、dp、sp及IOS的分辨率
- POJ 1470 Closest Common Ancestors
- n皇后(位运算版)
- Http Handler 介绍
- SparkRDD缓存策略
- 微服务之分布式跟踪系统(springboot+zipkin+mysql)
- 剑指Offer系列-面试题12:打印1到最大的n位数
- C++函数参数和返回值
- 栈的链式存储结构
- table表格合并封装的小插件
- Scala冒泡排序、快速排序、插入排序
- 腾讯信鸽消息推送
- [P1219]八皇后[位运算优化]