Spark的standalone环境搭建(1.6.0)
来源:互联网 发布:淘宝导航条特效代码 编辑:程序博客网 时间:2024/05/23 19:17
安装Scala
下载Scala,并解压到任意文件夹,并在环境变量中添加SCALA_HOME环境变量。在安装的时候我使用的Scala版本是2.10.4。值得注意的是Spark1.6是用的Scala2.10.5进行编译的,但是实际上2.10.4使用起来也没有问题。
将环境变量写入~/.bashrc和/etc/profile的做法在Hadoop的环境搭建中已经写出,这里不再赘述。
Spark的设置
Spark的设置相比Hadoop相对简单,在Spark的根目录下需要设置三个文件即可,即spark-env.sh、spark-defaults.conf、slaves。其修改的内容如下:
spark-env.sh
JAVA_HOME=/usr/lib/java/jdk1.8.0_73SCALA_HOME=/usr/lib/scala/scala-2.10.4HADOOP_CONF_DIR=/usr/local/hadoop/hadoop-2.6.0SPARK_MASTER_IP=172.18.128.192SPARK_MASTER_PORT=7077SPARK_MASTER_WEBUI_PORT=8080SPARK_WORKER_CORES=2SPARK_WORKER_MEMORY=6gSPARK_WORKER_PORT=7078SPARK_WORKER_WEBUI_PORT=8081SPARK_WORKER_INSTANCES=1
这里前面一部分主要设置了Java、Scala和Hadoop的位置
后面一部分设置了Master的IP、端口、WEB UI端口和Worker的工作核心数、工作内存大小、端口、WEB UI端口和实例数目
spark-defaults.conf
spark.master spark://alex:7077
这里主要设定了Spark Master的URL
slaves
alex
这里alex是host名称,也可以写成ip的形势,比如172.18.128.192
设置完成后,可以使用start-master.sh和start-slaves.sh命令后输入jps查询是否存在Master和Worker进程。
值得注意的是,start-slaves.sh命令后需要加上Master的URL
另外,Hadoop和Spark还有一些Web UI,其中我们之前设置了Spark Master的Web UI为8080端口,我们平时会用到的端口地址如下:
我们访问的话,只需要在浏览器中输入本机地址+端口号即可,例如浏览器中输入172.18.128.192:50070,即可访问HDFS文件系统
Spark Shell
为了和Hadoop的启动命令区分开来,我并没有将Spark的位置加入到环境变量中。因此我们需要到Spark的根目录启动Spark Shell,其命令如下:
./bin/spark-shell
接下来,我们就可以使用scala语言进行简单的程序测试了,官方给出了一个例子:
scala> val textFile = sc.textFile("README.md")scala> textFile.count() // Number of items in this RDD
这里的意思大概是将根目录下的README.md文件载入到RDD中,并统计RDD中这个项目的行数。
- Spark的standalone环境搭建(1.6.0)
- Spark的StandAlone模式环境搭建
- spark standalone模式 环境搭建
- spark standalone 集群环境搭建
- spark环境搭建--Standalone模式
- spark的standalone集群搭建
- Spark Standalone 以及 HDFS系统环境搭建
- Spark学习笔记之-Spark Standalone(环境搭建)
- Spark学习之(二)Spark 集群环境搭建(standalone)
- Spark运行环境的安装(Standalone)
- spark集群搭建,standalone
- Spark Standalone模式搭建
- Spark的环境搭建以及简单的eclipse的两种运行方式--standalone和yarn
- Spark Standalone环境配置
- Spark Standalone Mode 在 Win10 下搭建开发调试环境
- Spark Standalone Mode 搭建过程
- spark+hadoop Standalone模式 搭建
- spark standalone集群模式搭建
- 中国剩余定理算法详解(余数互质和不互质)
- android的view的生命周期
- UIMenuController
- 正则表达式,数字(含小数)
- 表示不同文件类型的魔术数字
- Spark的standalone环境搭建(1.6.0)
- github【如何删除一个repository(仓库)】
- TextView后加字体并改变颜色点击跳转
- UGUI实现技能cd效果
- Unity3D如何接入第三方的SDK - Android篇
- Resin 在同一台机器不同端口启动两个应用
- 解决 cocos android 接入友盟推送 sdk 在5.0以下的系统出现UnsatisfiedLinkError 错误
- C# Linq 交集、并集、差集、去重http://blog.csdn.net/joyhen/article/details/39578325
- linux遍历目录及其子目录