zookeeper的watcher机制及其在集群管理(sheepdog)中的使用

来源:互联网 发布:英语听力复读软件 编辑:程序博客网 时间:2024/05/16 09:17
ZK集群节点角色分为Leader和Follower(同步),Leader(接受请求,投票),2n+1个,得票过半成为Leader。读任何一个节点,写到Leader然后同步给follower
 
1、数据模型znode
     树模型,每隔叶子节点可以存少量数据,默认1M;
     两种znode(永久PERSISTENT和临时ZOO_EPHEMERAL ),临时的在会话超时之后server会自动清除且EPHEMERAL znodes不允许有子节点;
     sequential特性:zonde的序号是依次增加,int类型,最大2147483647,超过会溢出,(假设10年溢出,则可以每天产生588351次事件);
 
2、session
     2.1 client与server通信,需要建立session,client每隔 t/3发消息给server维持心跳,最大超时2*(tickTime*initLimit)。
     2.2 zk server list 可以更新。
 
3、watcher机制:
     3.1 设置:client可以对server上的某一个znode设置watcher,当该znode信息发生变化时,server会通知client,
     3.2 分类:data watcher (getData、exists)与 children watcher (getChildren)
     3.3 触发:watch的节点内容变化时触发;初次连接触发session事件;
     3.3 特性:
                一次性:watcher是一次性的,触发之后就会消失,所以要想继续知道节点变化信息,需要再次设置watcher;多次注册watcher,仅仅触发一次
               顺序性:收到的事件顺序与触发watcher顺序一致
               断开后收到不到事件,重连后收到断开的时间点到现在的事件;
 
4、用到的目录树
/ROOT/queue #事件队列  Persistent & Sequential
/ROOT/queue_pos #事件队列指针  Ephemeral
/ROOT/master #用于选举master Persistent & Sequential
/ROOT/member #用于判断节点离开 Ephemeral
/ROOT/lock #分布式锁,当前没用到
 
4.1 queue
/[ROOT]/queue/0000000058 [event]
BLOCK/UNBLOCK # 保证全集群串行执行某些操作的机制
NOTIFY # 用于把消息通知到全集群
JOIN/ACCEPT # 节点加入
RECONNECT/REACCEPT # 热升级
LEAVE # 已经废弃
 
4.2 queue_pos
/ROOT/queue_pos/node-A[pos], node-A格式IPv4 ip:10.160.70.12 port:7001,记录了node-A已经处理的事件位置,用于删除事件,(Len error问题)
 
4.3 master
/[ROOT]/master/0000000058[nodeA]
选举master,序号最小的节点为master
 
4.4 member
/[ROOT]/member/[nodeA] NULL
探测节点的离开