大数据Spark企业级实战版【学习笔记】----Spark Streaming
来源:互联网 发布:python现实世界 编辑:程序博客网 时间:2024/05/18 05:59
3. Spark GraphX
从官网的说明来看,GraphX是Spark中用于图与图并行计算的API,可以认为是GraphLab和Pregel(图计算模型)在Spark上的重写及优化。跟其他分布式图计算框架相比,GraphX最大的贡献是在Spark之上提供了一栈式数据解决方案,可以方便且高效的完成图计算的一整套流水作业。
GraphX的核心抽象是Resilient Distributed Property Graph,一种点和边都带属性的有向多重图。它扩展了Spark RDD的抽象,有Table和Graph两种视图,而只需要一份物理存储。两种视图都有自己独有的操作符,从而提高了操作灵活性和执行效率。
Table视图将图看成Vertex Property Table和Edge Property Table等的组合,这些Table继承了Spark RDD的API,如filter、map等。
Graph视图包括reverse、subgraph、mapV(E)、joinV(E)、mrTriplets等操作。
GraphX也提供了一套图算法工具包,方便用户对图进行分析。GraphX目前依然处于快速发展中。GraphX的架构如图1-12所示:
阅读全文
0 0
- 大数据Spark企业级实战版【学习笔记】----Spark Streaming
- 大数据Spark企业级实战版【学习笔记】----Spark Streaming
- 大数据Spark企业级实战版【学习笔记】-----Spark Streaming 的构架
- 大数据Spark企业级实战版【学习笔记】-----Spark Streaming的编程模式
- 大数据Spark企业级实战版【学习笔记】-----Spark Streaming案例分析
- 大数据Spark企业级实战版【学习笔记】---Spark简介
- 大数据Spark企业级实战版【学习笔记】----Spark术语
- 大数据Spark企业级实战版【学习笔记】----Spark技术生态系统之Spark Core
- 大数据Spark企业级实战版【学习笔记】----Spark Shark& Spark SQL
- 大数据Spark企业级实战版【学习笔记】----Spark R& MLBase
- 大数据Spark企业级实战版【学习笔记】----Spark速度为何如此快
- 大数据Spark企业级实战版【学习笔记】-----交互式SQL处理框架Spark SQL
- 大数据Spark企业级实战版【学习笔记】----Tachyon& BlinkDB&Akka
- 大数据Spark企业级实战版【学习笔记】----RDD:分布式函数式编程
- 大数据Spark企业级实战版【学习笔记】---- GraphX:图像计算框架
- spark学习笔记:Spark Streaming
- spark大数据处理技术读书笔记:spark streaming学习笔记
- Spark Streaming学习笔记
- ibatis jdbcType 用法
- 单链表的创建、测长、打印、插入、删除、排序及逆置
- mongodb3.4的falcon监控搭建
- hdu 6090 Rikka with Graph(思维 +贪心+轮图)
- python-opencv-matlab图像处理接口关系
- 大数据Spark企业级实战版【学习笔记】----Spark Streaming
- Unity3D的加载场景的代码
- JSON的三种解析方式
- SQL Sever 第四天
- DBMS_STATS.GATHER_TABLE_STATS详解 作用:DBMS_STATS.GATHER_TABLE_STATS统计表,列,索引的统计信息. DBMS_STATS.GATHER_
- Python学习笔记(五)-- Python字符串
- mysql 日期时间格式化
- EasyUI主题切换
- Map中的TreeMap根据value排序