程序博客网 > 光怪兽普利茨墨淘宝

Spark的原理

来源：互联网发布：光怪兽普利茨墨淘宝编辑：程序博客网时间：2024/05/29 19:37

Spark是一个围绕速度、易用性和复杂分析构建的大数据处理框架。

Spark有如下优势：

Spark提供了一个全面、统一的框架用于管理各种有着不同性质（文本数据、图表数据等）的数据集和数据源（批量数据或实时的流数据）的大数据处理的需求
官方资料介绍Spark可以将Hadoop集群中的应用在内存中的运行速度提升100倍，甚至能够将应用在磁盘上的运行速度提升10倍。

RDD：Spark的核心概念是RDD (resilient distributed dataset)，指的是一个只读的，可分区的分布式数据集，这个数据集的全部或部分可以缓存在内存中，在多次计算间重用。

Spark的核心思路就是将数据集缓存在内存中加快读取速度，同时用lineage关联的RDD以较小的性能代价保证数据的鲁棒性。

阅读全文

0 0

光怪兽普利茨墨淘宝

光怪兽普利茨墨淘宝

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子怡心湖马心怡心怡科技神怡心旷心悦神怡黄心怡心怡科技股份有限公司怡心湖消息怡心湖规划怡心居北戴河怡心花园宾馆心怡花园爹地别心急心急宝贝别心急都尿给你总裁大人别心急心急吃不了热豆腐全集贵妃有心急得宠着心急吃不了热豆腐意思心急梗塞都有什么症状婚婚欲睡总裁老公太心急天才萌宝爹地别心急免费阅读快穿系统男主别心急心急如什么成语心性心性是什么意思窦心性心率过缓向心性肥大名词解释什么是向心性肥胖向心性肥胖是什么意思远心性环状红斑向心性肥胖的病因向心性肥胖可以减掉吗急性心性梗塞向心性肥胖如何减肥心悦vip2多少钱才升到心悦会员2多少钱心悦3是什么梗心悦v3多少钱心悦3图片心悦3需要多少钱