zookeeper集群某台机器故障替换步骤

来源:互联网 发布:高新区网络问政平台 编辑:程序博客网 时间:2024/05/28 17:07

背景:

一个有5台机器的ZK集群,其中一台机器zk1.abc.com故障,需要将其替换下线。

说明:访问该ZK集群的客户端Java程序要加上定期更新域名解析的参数。

zoo.cfg配置文件如下:

tickTime=2000

initLimit=10

syncLimit=5

dataDir=/home/hadoop/cluster-data/zk/data

clientPort=2181

maxClientCnxns=20

maxSessionTimeout=360000

autopurge.snapRetainCount=1000

autopurge.purgeInterval=24

server.1:zk1.abc.com:2888:3888

server.2:zk2.abc.com:2888:3888

server.3:zk3.abc.com:2888:3888

server.4:zk4.abc.com:2888:3888

server.5:zk5.abc.com:2888:3888

变更步骤:

1. 找一台新机器安装软件

sudo yum install -b current -y jdk-1.7.0_75-83.el5 zookeeper-3.4.5-3;

2. 准备好配置文件

/home/admin/zookeeper/conf/zoo.cfg   内容不变

/home/admin/zookeeper/data/myid      设置比当前集群所有myid大1,myid大的向myid小的建立连接。

3. 启动ZK

$sudo -u admin /home/admin/zookeeper/zkServer.sh start

4. 查看ZK所有机器的状态,如果新机器的Node count与其它节点的数值一致,则认为启动正常。

$echo stat|nc localhost 32188|tail -n 8

5.变更故障机域名zk1.abc.com指向新机器的IP地址