spark2.0-scala2.11.8-hadoop2.8.0配置
来源:互联网 发布:下载最快的软件 编辑:程序博客网 时间:2024/05/20 15:10
一、安装配置scale
1.下载scala 2.11.8
http://www.scala-lang.org/files/archive/scala-2.11.8.tgz
tar -zxf scala-2.11.8.tgz –C ./app
2.配置环境变量
vim /etc/profile(root用户)
# 在文件末尾位置加入以下代码
export SCALA_HOME=/usr/lib/scala-2.11.8
export PATH=$PATH:$SCALA_HOME/bin
3.生效环境变量
source /etc/profile(hadoop用户)
4.测试环境变量配置是否成功
scala命令进入scala命令行,ctrl + c强制退出
二、安装配置spark
1.下载spark2.0
方法一:https://d3kbcqa49mib13.cloudfront.net/spark-2.0.0-bin-hadoop2.7.tgz
方法二:https://d3kbcqa49mib13.cloudfront.net/spark-2.0.0-bin-without-hadoop.tgz
还需要下载方法一的压缩包,
将方法一jars文件夹下的包除了图中所示的这几个包,全部拷贝到without hadoop的jars中,然后图中那些包除了hadoop-clent这个包其他包都能够在hadoop2.8.0中找到2.8.0的版本jar包,将这些jar包拷贝到without hadoop的jars中,然后去maven官网(http://mvnrepository.com/artifact/org.apache.hadoop/hadoop-client)下载hadoop-clent-2.8.0.jar这个包,下载完成后拷贝到withouthadoop的jars中。
2.配置环境变量
vim /etc/profile
# 在文件末尾位置加入以下代码
exportSPARK_HOME=$HOME/spark-2.0.0-bin-hadoop2.7
3.修改spark-2.0.0-bin-hadoop2.7/conf/spark-env.sh文件(从节点主节点都需要修改)
如果没有则进行复制cp spark-env.sh.template spark-env.sh
#端口号
SPARK_MASTER_WEBUI_PORT=8085
exportSCALA_HOME=/home/node1/app/scala-2.11.8
exportJAVA_HOME=/home/node1/app/jdk1.8.0_131
export SPARK_MASTER_IP=192.168.0.194
export SPARK_WORKER_MEMORY=1024m
export master=spark://192.168.0.194:7070
4.主节点还需配置
vi /etc/hosts
内容:
192.168.0.192 slave1
192.168.0.193 slave2
192.168.0.194 master
三、启动
1.计算Pi
./bin/run-example SparkPi
四、启动spark集群
sbin/start-all.sh
jps显示
- spark2.0-scala2.11.8-hadoop2.8.0配置
- Scala2.11.8 + Sbt + Maven + IntelliJ Idea + Spark2.0开发环境搭建备忘
- spark 1.6.0 安装与配置(spark1.6.0、Ubuntu14.04、hadoop2.6.0、scala2.10.6、jdk1.7)
- spark1.6.1及scala2.11.8安装配置
- Spark2.2.0 + Scala2.13.0集群搭建
- spark2.0+hadoop2.7.1简单部署
- Spark2.0安装配置
- 安装配置Hadoop2.7.5+Spark2.2.1伪分布式环境
- Linux安装单机版Spark(CentOS7+Spark2.1.1+Scala2.12.2)
- Linux安装单机版Spark(CentOS7+Spark2.1.1+Scala2.12.2)
- Linux安装Spark集群(CentOS7+Spark2.1.1+Hadoop2.8.0)
- Linux安装Spark集群(CentOS7+Spark2.1.1+Hadoop2.8.0)
- CentOS7 基于Hadoop2.7 的Spark2.0集群搭建
- Spark2.0 + Hadoop2.7.2 + Centos7 集群部署<一>
- CentOS7 基于Hadoop2.7 的Spark2.0集群搭建
- CentOS7 基于Hadoop2.7 的Spark2.0集群搭建
- scala2.0-杂记
- scala2
- raid5_cache.c数据结构之r5l_io_unit
- Netty5.0+ 心跳机制(四)
- Item属性
- 09 redis集群的搭建 以及遇到的问题
- office图标显示异常和新建时图标没有显示等问题解决
- spark2.0-scala2.11.8-hadoop2.8.0配置
- 124. Binary Tree Maximum Path Sum&145.Binary Tree Postorder Traversal
- OpenGL蓝宝书源码学习(十七)第六章——DiffuseLight.cpp
- Netty处理TCP连接的session
- samba 的配置
- 发送邮件
- hibernate学习之一——Jdbc回顾
- 删除单链表指定节点
- 1088滑雪(dp+搜索)