Spark缓存策略说明及选择
来源:互联网 发布:淘宝真丝客服沟通技巧 编辑:程序博客网 时间:2024/06/07 04:43
提高RDD的使用效率。
Spark缓存策略示例:
0.NONE(不需要缓存)
参数:_useDisk, _useMemory, _useOffHeap, _deserialized, _replication(默认值为1)
1.DISK_ONLY
参数:_useDisk, _useMemory, _useOffHeap, _deserialized, _replication(默认值为1)
2.DISK_ONLY_2
副本2份
参数:_useDisk, _useMemory, _useOffHeap, _deserialized, _replication(默认值为1)
3.MEMORY_ONLY(默认的)
参数:_useDisk, _useMemory, _useOffHeap, _deserialized, _replication(默认值为1)
4.MEMORY_ONLY_2
参数:_useDisk, _useMemory, _useOffHeap, _deserialized, _replication(默认值为1)
5.MEMORY_ONLY_SER
SER做序列化。会消耗CPU。
参数:_useDisk, _useMemory, _useOffHeap, _deserialized, _replication(默认值为1)
6.MEMORY_ONLY_SER_2
参数:_useDisk, _useMemory, _useOffHeap, _deserialized, _replication(默认值为1)
7.MEMORY_AND_DISK
内存中若放不下,则多出的部分放在机器的本地磁盘上,区别于MEMORY_ONLY(内存中若放不下,则多出的部分原来在哪就还在哪)
参数:_useDisk, _useMemory, _useOffHeap, _deserialized, _replication(默认值为1)
8.MEMORY_AND_DISK_2
参数:_useDisk, _useMemory, _useOffHeap, _deserialized, _replication(默认值为1)
9.MEMORY_AND_DISK_SER
参数:_useDisk, _useMemory, _useOffHeap, _deserialized, _replication(默认值为1)
10.MEMORY_AND_DISK_SER_2
参数:_useDisk, _useMemory, _useOffHeap, _deserialized, _replication(默认值为1)
11.OFF_HEAP(不使用堆,比如可以使用Tachyon)
参数:_useDisk, _useMemory, _useOffHeap, _deserialized, _replication(默认值为1)
如何选择RDD的持久化策略?
1.Cache() MEMEORY_ONLY
2.MEMORY_ONLY_SER
3._2
4.能使用内存就不使用磁盘
- Spark缓存策略说明及选择
- varnish缓存策略及缓存时间计算方法说明
- Spark之缓存策略
- Spark算子选择策略
- 缓存穿透、缓存并发、缓存失效说明及对应处理策略
- spark调优-持久化策略选择
- spark-submit使用及说明
- Spark-SQL介绍及优化策略
- CDN缓存策略FAQ及更新频率
- Spark Shell各种操作及详细说明
- spark-cluster及yarn-client说明
- iOS缓存 NSCache详解及SDWebImage缓存策略源码分析
- IDE之eclipse选择及说明
- 缓存策略;
- 缓存策略
- 缓存策略
- 缓存策略
- Spark任务调度流程及调度策略分析
- 送分题!考研数学压轴必考题型是......
- 闭包
- Andriod含跳转的简单计算器
- 浅谈Maven
- java常量池概念
- Spark缓存策略说明及选择
- python pass (空操作)语句
- UISearchBar类介绍与使用和UISearchController的使用
- 20170628
- C++学习6:static关键字
- form提交
- android菜鸟练手小项目之自定义日历,涵盖LitePal数据库,极光推送,聊天机器人(四)
- (二)二叉树
- ZooKeeper 倪超著 观后感