Spark的安装方法
来源:互联网 发布:linux ip地址映射 编辑:程序博客网 时间:2024/06/05 18:51
Spark安装方法(standalone模式)
一、简单认知,什么是Spark?
Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,(注:如果不保存将会消失)因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。
官网对spark速度介绍:
Speed
Run programs up to 100x faster than Hadoop MapReduce in memory, or 10x faster on disk.也就是说Spark比hadoop快100倍,当然官方拿来测试的例子IO读写操作比较多,这正是Hadoop的不足和Spark基于内存计算的长处。
二、Spark的下载
官网下载地址(http://spark.apache.org/downloads.html)点击箭头指示方向下载
(注:可以在选项一选择Spark的发行版本,选项二中选择下载的包类型,选项三选择下载类型。)
三、Spark的安装
安装前确定你的jdk已经安装过了
把文件上传到你的linux机器上找到该文件
1、解压文件:
tar -zxvf spark-1.6.1-bin-hadoop2.6.tar.gz
后面的参数根据你下载的文件版本名而定
2、找到conf目录打开
cd spark-1.6.1-bin-hadoop2.6/conf/3、修改spark的环境变量文件spark-env.sh
vim spark-env.sh添加以下配置
export JAVA_HOME=/opt/jdk1.8.0_121 export SPARK_MASTER_IP=master export SPARK_MASTER_PORT=7077 export HADOOP_CONF_DIR=/home/hadoop/software/hadoop-2.7.3注意:这里的JAVA_HOME为你的java安装目录
SPARK_MASTER_IP为你的master节点的ip地址,可以写hostname前提是你配置了hosts文件中的ip映射
SPARK_MASTER_PORT为端口号
最后一个为你的Hadoop配置目录,可以不写
4、修改slaves文件
在slaves文件中添加作为worker结点的ip地址(可以写hostname前提是你的hosts文件中配置了ip映射),类似于Hadoop配置中的slaves文件
5、分发文件到其他结点
如果你配置了ssh免密码登录的话可以使用命令:
scp -r spark-1.6.1-bin-hadoop2.6/ slave01:~/software/注意这里slave01为我的worker结点hostname
顺便介绍一下快速配置ssh的命令(ssh-copy-id hostname)
6、测试是否安装成功
使用命令
./sbin/start-all.sh或者进入spark-1.6.1-bin-hadoop2.6目录下的sbin目录中使用./start-all.sh
完成启动之后jps命令查看master和worker的运行状态
Spark为主从结构,看见worker和master都启动成功,表示安装成功
1 0
- spark的安装方法
- Spark的安装方法
- Spark的安装
- Spark的安装,编译
- spark的安装配置
- Spark的安装
- spark的集群安装
- Spark集群的安装
- Apache Spark 的安装
- 【Spark】Spark的Standalone模式安装部署
- spark的RDD 安装spark如下
- Spark(1)——Spark的安装
- 【Spark】Spark的Standalone模式安装部署
- ubuntu16.10 安装spark及其启动ipython方法,删除anaconda的方法
- Spark 0.9的安装配置
- spark与shark的安装
- spark的配置与安装
- spark的安装过程记录
- 安装django
- MySQL连接查询(交叉连接,左连接,右连接,全连接,子查询,联合查询)
- java泛型
- react-native 填坑之canOverrideExistingModule=true
- 正整数或一位小数或者俩位小数的正则表达式的写法
- Spark的安装方法
- Docker搭建disconf环境,三部曲之一:极速搭建disconf
- matlab基础
- angular springboot跨域访问
- 聊聊技术选型
- Netty入门--AIO
- 开篇
- React-Native 性能优化 个人总结
- Ionic开发实战
原创粉丝点击
热门IT博客
热门问题
老师的惩罚
人脸识别
我在镇武司摸鱼那些年
重生之率土为王
我在大康的咸鱼生活
盘龙之生命进化
天生仙种
凡人之先天五行
春回大明朝
姑娘不必设防,我是瞎子
海参炖什么
海参可以和鸡蛋一起吃吗
海参长什么样子
干海参如何保存
海参头数是什么意思
一斤海参多少个
幼儿可以吃海参吗
海参保存
海参为什么越煮越硬
夏天吃海参好吗
海参营养价值高吗
海参一斤多少个头的好
小孩吃海参好吗
海参有什么作用
海参几头什么意思
海参几个头是什么意思
海参怎样保存
海参如何保存
吃海参会过敏吗
海参吃多久会有效果
海参产地
一斤干海参有多少个
干海参的吃法
干海参的家常做法大全
干海参保质期多长时间
干海参的家常做法
淡干海参和纯干海参
纯干海参
干海参价
海参干多少钱
怎样选购海参
干海参的价位
80头海参多少钱一斤
海参的价位
怎么发干海参
海参的泡法方法
一斤海参价格
干海参价位
干海参和鲜海参哪个好
海参粥的功效
怎么食用海参