一:Spark介绍
来源:互联网 发布:网页游戏自动挂机软件 编辑:程序博客网 时间:2024/06/05 02:04
spark
快速,通用的大规模数据处理技术。
【speed】
执行mr作业程序在内存比Hadoop快100倍。
spark有GAG执行引擎,支持离散数据流和内存计算。
【易于使用】
多种语言编写。 Java Scala Python
spark有着自己的集群计算技术,扩展了Hadoop mr模型用于高效计算,包括交互式查询和流计算,主要的特性就是基于内存的集群计算提升计算速度。
spark部署的三种模式
1. standalone,独立模式
在hdfs上分配空间,spark和mr同时运行,覆盖到所有job
2. spark yarn
在yarn上运行,不需要预先安装或要求root访问
有助于spark和Hadoop生态系统进行集成
3. spark in mapreduce
spark组件:
1. spark core (内核)
内核位于执行引擎之上,所有功能都在其上进行构建,提供内存计算和外部存储系统的数据集引用
2. spark SQL
增加对sql及hive的支持
3. spark streaming
用于流计算
4. MLLib
机器学习框架
5. GraphX
分布式图计算框架
0 0
- 一:Spark介绍
- Spark api介绍一
- spark调优(一)【spark参数介绍】
- [MLLib]一、Spark MLLib介绍
- 一.xmpp openfire smack spark介绍
- Spark MLlib系列(一):入门介绍
- Spark MLlib系列(一):入门介绍
- Spark MLlib系列(一):入门介绍
- Spark MLlib系列(一):入门介绍
- Spark MLlib系列(一):入门介绍
- Spark学习(一)基础介绍
- Spark快速大数据分析-Spark介绍(一)
- spark介绍
- spark介绍
- spark介绍
- Spark 介绍
- spark 介绍
- Spark介绍
- poj 2386 Lake Counting(dfs)
- 【JavaScript】 判断横竖屏
- C++开源日志库选择
- java 稀疏矩阵
- 解决LibclangError: [Error 193] %1 不是有效的 Win32. To provide e Config.set_library_path() or Config.
- 一:Spark介绍
- 搜索二维矩阵
- 头文件和宏模板
- mybatis一对多查询过程只查询了一个结果
- FFMpeg Intro - Subtitles and Metadata
- 简介Swift面向协议编程
- 设置Sublime Text新标签页打开文件
- 【JavaScript】表单效验
- mysql创建外键原则