Zookeeper(五)集群管理

来源:互联网 发布:淘宝比较好的灯饰店 编辑:程序博客网 时间:2024/06/12 14:49

在一台机器上运营一个Zookeeper实例称之为单机模式(Standalone)。单机模式的缺陷是一旦唯一的实例挂掉了,依赖Zookeeper的应用就都用不了了。

在实际应用中,一般都是采用集群模式来部署Zookeeper,集群中的server为奇数(2n+1)。只要集群中的多数(大于n+1台)Server活着,集群就能对外提供服务。

在每台机器上部署一个Zookeeper实例,多台机器组成集群称之为完全分布式集群。此外,还可以在仅有的一台机器上部署多个Zookeeper实例,以伪集群模式运行

5.1 集群配置

我这里是在虚拟机上搭建的完全分布式集群。

# The number of milliseconds of each ticktickTime=2000# The number of ticks that the initial # synchronization phase can takeinitLimit=10# The number of ticks that can pass between # sending a request and getting an acknowledgementsyncLimit=5# the directory where the snapshot is stored.# do not use /tmp for storage, /tmp here is just # example sakes.dataDir=/mysoftware/zookeeper-3.4.9/zkDatadataLogDir=/mysoftware/zookeeper-3.4.9/zkLogs# the port at which the clients will connectclientPort=2181server.1=slave01:2888:3888server.2=slave02:2888:3888server.3=slave03:2888:3888

需要注意的是,集群中所有的实例作为一个整体对外提供服务,集群中每个实例之间都互相连接,所以,每个配置文件中都要列出所有实例的映射关系。

在每个配置文件的末尾,有几行“server.A=B:C:D”这样的配置,其中, A 是一个数字,表示这个是第几号服务器;B 是这个服务器的 ip 地址(我这里在本地做了域名解析);C 表示的是这个服务器与集群中的 Leader 服务器交换信息的端口;D 表示的是万一集群中的 Leader 服务器挂了,需要一个端口来重新进行选举,选出一个新的 Leader,而这个端口就是用来执行选举时服务器相互通信的端口。如果是伪集群的配置方式,由于 B 都是一样,所以不同的 Zookeeper 实例通信端口号不能一样,所以要给它们分配不同的端口号。


除了修改 zoo.cfg 配置文件,集群模式下还要配置一个myid文件,这个文件在 zkData 目录下,文件里只有一个数据,就是 A 的值,Zookeeper 启动时会读取这个文件,拿到里面的数据与配置信息比较从而判断到底是那个 Server。


5.2 集群启动

【分别启动三个从机上的Zookeeper服务】


先用ssh 无密码切换到各个从机,启动Zookeeper服务,这里只以slave01从机为例。

【查看server状态】


这里提供一个自己写的zookeeper 管理的shell脚本:

#!/bin/bashfor index in 1 2 3do    echo "开始 ${1} slave0${index}下的zookeeper"    ssh slave0${index} "source ~/.profile;/mysoftware/zookeeper-3.4.9/bin/zkServer.sh ${1}"done


可见,现在的集群中,slave03充当着Leader角色,而slave01与slave02充当着Follower角色。

使用客户端连接slave03 zookeeper.



【新建newNode节点】


在slave01客户端查看:


在slave02客户端查看:


可见,集群中的Server保持着数据同步。

5.3 集群容灾

如果我们把Leader的slave03关闭,会发生什么?


可见,集群自动完成了切换,slave02变成了Leader。实际应用中,如果集群中的Leader宕机了,或者Leader与超过半数的Follower失去联系,都会触发ZooKeeper的选举流程,选举出新的Leader之后继续对外服务。

如果我们再把zk3关闭,会发生什么呢?


可见,关闭zk3以后,由于集群中的可用Server只剩下一台(达不到集群总数的半数以上),集群将处于不可用的状态。


文章参考:ZooKeeper之(五)集群管理