Spark学习之一-Spark的概念机器发展简史
来源:互联网 发布:mac 编译安装php5.6 编辑:程序博客网 时间:2024/05/29 03:18
1.Spark是什么?
spark是一个用来实现快速而通用的集群计算的平台
速度方面:扩展了MapReduce的计算模型
特点:在内存中进行计算,就算是在磁盘上计算也比MapReduce快
Spark使我们可以简单而低耗的把各种处理流程结合在一起
Spark可以运行在Hadoop集群之上,访问包括Cassanda在内的任意hadoop数据源
2.Spark软件栈
SparkCore、SparkSQL(操作结构化数据的程序包)、Spark Streaming(对实时数据库进行流式计算的组件)
MLib(机器学习功能组件)、GraphX
3、Sprak简史
产生的原因:研究人员发现MapReduce在迭代计算和交互式计算的任务下表现的效率低下,因此Spark的产生将为交互式查询和迭代算法设计的,同时还支持内存式存储和高效的容错机制。
阅读全文
0 0
- Spark学习之一-Spark的概念机器发展简史
- Spark机器学习的一些概念整理
- 机器学习发展简史
- spark mllib机器学习之一 LogisticRegressionWithLBFGS
- Spark机器学习的主要内容
- spark_1:spark的发展
- Spark的发展历程
- Spark学习(二)-Spark的相关概念
- Spark 机器学习《一》
- SPARK机器学习库
- Spark机器学习2
- Spark机器学习1
- Spark机器学习5
- Spark机器学习3
- Spark机器学习示例
- Spark机器学习读书笔记
- spark机器学习-前言
- Spark 机器学习拾遗
- 读书的五个境界
- 使用aspose.words for java 进行多文档间的转换操作
- linux下文件乱码问题及编码方式
- 二叉树的遍历(非递归形式)
- “虚拟机”之 Centos的初步操作
- Spark学习之一-Spark的概念机器发展简史
- 2425: [HAOI2010]计数
- spring cloud
- 2018阿里秋招C/C++研发编程题——字符串处理
- java基础第二十一天 JDK新特性 反射
- ALV字段编辑时,输入长度受限制解决方法
- Spark学习之二-Spark入门
- 利用maven搭建一个简单的hibernate示例
- java后台分层