ZooKeeper 常用应用场景原理详解

来源:互联网 发布:数据库数据太多 编辑:程序博客网 时间:2024/06/06 06:48

          ZooKeeper 常用应用场景原理详解

             zookepper存放数据的目录结构类似于标准的文件系统格式,如果使用过window或linux就能体会到其内部的数据结构,简化结果如下:

           

       主要基本概念

             1.每个目录都被称为znode,如唯一标识分别为为“/org”,"/com/lance" 和 “/com/lance/zk”。
             2.每个znode可以存储数据,
             3.znode的类型
                    a. PERSISTENT    
                                   // 该znode不会在client断开时被zookepper自动删除,除非client端主动删除
                    b. PERSISTENT_SEQUENTIAL  
                                     // 该znode不会在client断开时被zookepper自动删除,除非client端主动删除, 
                                     // 且znode的名字后缀会添加上单调递增的数字,实现自动编号
                    c. EPHEMERAL        
                                     // 该znode会在client断开时被zookepper自动删除
                    d. EPHEMERAL_SEQUENTIAL      
                                     // 该znode会在client断开时被zookepper自动删除,除非client端主动删除, 
                                     // 且znode的名字后缀会添加上单调递增的数字,实现自动编号
              4.EPHEMERAL节点不能有子节点目录
              5.znode有版本概念
              6.znode可以被client监控,当该节点发生变化时,zookepper将向client发送通知(但不会把修改后的数据发给client,client要想回去数据,必须重新读取该目录下的数据)

              7. Watcher接口,Client向Zookepper注册某个znode节点的监控,并传入Watcher的实现类(如class WatcherImpl implments Watcher),当该znode节点发生变更时,Zookepper就会通过回调执行WatcherImpl.process()方法,以进行下一步的操作。

    1. 数据订阅/发布

              使用Zookepper的订阅/场景可以实现配置中心,即数据发布/订阅系统

               例如,项目的配置数据放在了/com/lance/zk目录下,n台机器实现对/com/lance/zk目录的监控,即注册一个Watcher监控(implments Watcher),当/com/lance/zk节点发生数据变更时,n台机器将获得变更通知,从而n台机器重新获取/com/lance/zk目录下的数据。

      2. 心跳检测

            在分布式系统中,各机器之间需要知道其他机器是否运行正常,最原始的方法是通过固定时间间隔的PING或建立长连接的方式检测心跳。如果基于Zookepper的话,在Zookeeper指定目录下每台机器都创建EPHEMERAL临时子节点,这样不同的机器就根据这些临时子节点判断其他机器是否正常,这样各机器之间不再直接耦合关联。

       3. 负载均衡

          假如我们在/com/lance/zk为域名节点,3个provider将自己的机器IP和端口号192.168.0.1:8001、192.168.0.2:8001、192.168.0.3:8001都注册到/com/lance/zk节点,当有一个consumer向zookepper获取/com/lance/zk目录下的IP列表,通过hash,轮询或随机方式获取其中一个IP,然后调用。

         心跳检测:client使用固定时间间隔,如3秒,向zookepper发送服务其状态是否正常信息,一旦超过3秒没有没有收到状态信息,那么就认为该IP不可用,于是该IP就会被清理。         

        典型的实现例子:alibaba的dubbo服务

       4.全局唯一ID生成服务

             每一个client根据自己的属性,如机器IP:172.17.110.2,通过create()接口创建EPHEMERAL_SEQUENTIAL 类型的znode,zookepper返回“172.17.110.2-00000000011”,client拿到返回值后,再添加具体的服务类型,如:createData,则就获取了全局唯一ID:createData-172.17.110.2-00000000011。

         5. 任务进度汇总

           各服务机器将自己的任务进行进度写入到Zookepper的指定临时节点中,这样系统中心和各台机器都能够获取其他任务的进度。

         6. 集群管理

                 集群管理中心在Zookepper的/com/lance/clusters节点上添加一个Watcher监听,所有被管理的机器都在/com/lance/clusters创建临时子节点,如/com/lance/clusters/hostName,被管理的机器需要在指定时间间隔,如3秒,内向/com/lance/clusters/hostName发起会话,如果超时这个时间间隔没有发起会话,者Zookepper认为该机器已经宕机,就会删除/com/lance/clusters/hostName这个临时子节点,这样管理中心就能够检测到每台机器的运行情况了。




        参考资料:1.《从PAXOS到ZOOKEEPER分布式一致性原理与实践》.作者:倪超

                            2. 分布式服务框架 Zookeeper -- 管理分布式环境中的数据

0 0