Spark2.0安装配置
来源:互联网 发布:怎么成为淘宝安装师傅 编辑:程序博客网 时间:2024/05/29 04:47
1. 下载
截止我写这篇文章的日期,spark的最新版本为2.0.0,因为我测试环境的hadoop版本是2.6.4的,所以我选择spark的版本是2.0.0,Hadoop是2.6;进入Apache Spark官网的下载页下载。
2. 环境配置
集群环境:
将下载好的spark-2.0.0-bin-hadoop2.6.tgz拷贝到主机master上的/usr/local目录中,并执行命令解压到当前目录中:
tar -zxf spark-2.0.0-bin-hadoop2.6.tgz
解压后的目录结构如下:
修改目录conf中的配置文件来配置spark的运行环境,conf目录中包含的文件有:
我们主要修改spark-env.sh这个文件。拷贝spark-env.sh.template并重命名为spark-env.sh:
cp spark-env.sh.template spark-env.sh,结果如下:
接下来修改spark-env.sh,主要添加以下几项配置:
执行sbin/start-all.sh命令,查看是否能够启动spark,查看是否有Worker和Master进程。
运行spark提供的示例检测:bin/run-example JavaSparkPi 5 2
至此,单个节点的Spark环境配置结束。
3. 多个节点的集群环境配置
在上述单个节点启动成功的基础上,配置多个节点集群环境是比较简单的一件事情。
- 修改master上节点的slaves配置文件来配置Worker节点的位置,这里我将node1、node2、node3作为Worker节点的运行机器,在conf/slaves(复制slaves.template)中添加node1、node2和node3。
- 将master上配置好的spark目录文件全部分别拷贝到node1、node2和node3所在机器上(可以通过ansible这个工具来操作)。
通过命令sbin/start-all.sh启动spark集群
也可以通过浏览器来查看集群状态,在浏览器中通过spark主节点的8080端口可以查看集群状态,在浏览器中输入:http://master:8080
4. 运行测试
Standalone模式的测试
在shell环境下运行Spark提供的案例程序JavaSparkPi,通过如下命令:
bin/spark-submit –class org.apache.spark.examples.JavaSparkPi –master spark://master:7077 examples/jars/spark-examples_2.11-2.0.0.jar 10 4
shell界面输出如下信息:
从shell界面我们不能得到什么信息,我们可以通过浏览器来查看执行这个应用的具体信息,在浏览器中输入http://master:8080,我们将看到如下信息:
点击Completed Applications中的链接,我们可以查看运行这个应用所消耗的资源情况:
点击Completed Drivers下的超链来查看应用程序driver进程所在节点的信息,通过这个节点我们也可以查看整个应用程序的输入结果信息。
点击上图中的stdout,我们可以查看整个应该程序的输出结果。如下:
- Spark2.0安装配置
- spark2.2.0安装配置
- Spark2.1.0安装和配置
- Spark2.0安装
- Spark2.0安装
- Spark2.0.1伪分布式安装配置
- spark2.0-scala2.11.8-hadoop2.8.0配置
- hive2.3-spark2.0-yarn 安装
- kylin2.0 安装与 Spark2.1 集成
- Mac下Spark2.1.0的伪分布式安装配置
- 安装配置Hadoop2.7.5+Spark2.2.1伪分布式环境
- spark2.0
- spark2.0
- VMware虚拟机内安装的Ubuntu 16.04设置静态IP地址 spark2.0集群固定IP配置
- Spark2.1.1Idea配置
- spark2.2.0 SBT配置
- spark2.1集群安装
- centos6.5安装spark2
- LASSO和L1正则包liblinear,glmnet使用和对比
- cell里面 self 和self.contentview的区别
- 快捷注释方式
- opengles之展翅飞翔的雄鹰
- 集成引擎Jenkins-前言
- Spark2.0安装配置
- 将项目提交到Git两个不同的仓库
- 关于伪元素和伪类
- zookeeper使用和原理探究(一)
- 实现点击按钮后,一个文本框中的值复制到另一个中。
- 蓝桥杯马虎等式
- 使用jQuery实现简单的邮箱验证
- Spring JdbcTemplate方法详解
- 内部类