Spark集群中HA环境搭建

来源：互联网发布：mac ai的zh cn汉化包编辑：程序博客网时间：2024/06/07 17:15

1.环境介绍
（1）操作系统ubuntu16.4.0
（2）两个节点：spark1(192.168.232.147),spark2(192.168.232.152) (生产环境下一般配置3台)
（3）两个节点上都装好了Hadoop 2.2集群
2.安装Zookeeper3.4.5
（1）下载Zookeeper：http://apache.fayea.com/zookeeper
（2）解压到/root/install/目录下
（3）创建两个目录，一个是数据目录，一个日志目录

QQ截图20140726110322.png (16.42 KB)

下载附件保存到相册

2014-7-26 11:05 上传

（4）配置：进到conf目录下，把zoo_sample.cfg修改成zoo.cfg（这一步是必须的，否则zookeeper不认识zoo_sample.cfg），并添加如下内容（各端口的意义可goole参看）

dataDir=/root/install/zookeeper-3.4.5/data
dataLogDir=/root/install/zookeeper-3.4.5/logs
server.1=spark1:2888:3888
server.2=spark2:2888:3888

注：zoo_sample.cfg中自带默认的dataDir，需屏蔽掉；

（5）在/root/install/zookeeper-3.4.5/data目录下创建myid文件，并在里面写1(1与server.1对应)

cd /root/install/zookeeper-3.4.5/data
echo 1>myid

（6）把/root/install/zookeeper-3.4.5整个目录复制到其他节点

scp -r /root/install/zookeeper-3.4.5 root@spark2:/root/install/

（7）登录到spark2节点，修改myid文件里的值，将其修改为2（2与server.2对应）

cd /root/install/zookeeper-3.4.5/data
echo 2>myid

（8）在spark1,spark2两个节点上分别启动zookeeper

cd /root/install/zookeeper-3.4.5
bin/zkServer.sh start

（9）查看进程进否成在

[root@spark2 zookeeper-3.4.5]# bin/zkServer.sh start
JMX enabled by default
Using config: /root/install/zookeeper-3.4.5/bin/../conf/zoo.cfg
Starting zookeeper ... STARTED
[root@spark2 zookeeper-3.4.5]# jps
2490 Jps
2479 QuorumPeerMain

3.配置Spark的HA
（1）进到spark的配置目录，在spark-env.sh修改如下

export SPARK_DAEMON_Java_OPTS="-Dspark.deploy.recoveryMode=ZOOKEEPER -Dspark.deploy.zookeeper.url=spark1:2181,spark2:2181 -Dspark.deploy.zookeeper.dir=/spark"
export JAVA_HOME=/root/install/jdk1.7.0_21
#export SPARK_MASTER_IP=spark1 #配置zk后此处不再需要配置
#export SPARK_MASTER_PORT=7077
export SPARK_WORKER_CORES=1
export SPARK_WORKER_INSTANCES=1
export SPARK_WORKER_MEMORY=1g

（2）把这个配置文件分发到各个节点上去

scp spark-env.sh root@spark2:/root/install/spark-1.0/conf/

（3）启动spark集群

[root@spark1 spark-1.0]# sbin/start-all.sh
starting org.apache.spark.deploy.master.Master, logging to /root/install/spark-1.0/sbin/../logs/spark-root-org.apache.spark.deploy.master.Master-1-spark1.out
spark1: starting org.apache.spark.deploy.worker.Worker, logging to /root/install/spark-1.0/sbin/../logs/spark-root-org.apache.spark.deploy.worker.Worker-1-spark1.out
spark2: starting org.apache.spark.deploy.worker.Worker, logging to /root/install/spark-1.0/sbin/../logs/spark-root-org.apache.spark.deploy.worker.Worker-1-spark2.out

（4）进到spark2(192.168.232.152)节点，把start-master.sh 启动，当spark1(192.168.232.147)挂掉时，spark2顶替当master

[root@spark2 spark-1.0]# sbin/start-master.sh
starting org.apache.spark.deploy.master.Master, logging to /root/install/spark-1.0/sbin/../logs/spark-root-org.apache.spark.deploy.master.Master-1-spark2.out

（5）查看spark1和spark2上运行的哪些进程