对spark中RDD的理解

来源：互联网发布：数组java定义编辑：程序博客网时间：2024/06/04 10:44

update at 2016.1.25

RDD作者的论文链接

https://www.cs.berkeley.edu/~matei/papers/2012/nsdi_spark.pdf

论文的理解：
spark要解决的问题：
1、有些数据要多次读写，磁盘速度很慢
2、没有交互的界面，不能看到中间结果
适用的应用：
1、机器学习：多个迭代次运算，逼近（优化问题）。==》是不是三维重建中优化也可以用到这个
2、计算结果还要用的：pagerank
解决办法==》数据抽象成RDD+memory-cache

其中提到finer- grained shared memory abstractions ，那么coarse又是什么呢
没看懂RDD是怎么实现的

继续学习

0 0

对spark中RDD的理解
对spark中RDD的API的理解
spark中对rdd的几个操作
SPARK中对RDD的基本操作
spark RDD的理解
理解Spark的RDD
spark RDD的理解
Spark RDD的理解
理解Spark的RDD
那些年我们对Spark RDD的理解
那些年我们对Spark RDD的理解
理解Spark的核心RDD
理解Spark的核心RDD
理解Spark的核心RDD
理解Spark的核心RDD
理解Spark的核心RDD
理解Spark的核心RDD
理解Spark的核心RDD
Ubuntu14.04(64位)+Ｃuda7.5+Ｃudnn7.0+Caffe+Ｍatlab(Linux版)
确保对象的唯一性——单例模式
推荐：ARC下需要注意的内存管理
前端系列 | 2015年双11手淘前端技术巡演 - 前言
TortoiseGit 使用说明
对spark中RDD的理解
图解TCP-IP协议
文本数据的机器学习自动分类方法(下)
多态
Java工程师成神之路
Hibernate Tools-代码生成
cvFilter2D() 卷积初步了解
安卓中SQLite的最简单使用（二）
模拟迅雷登陆