keepalived安装部署及Flume+keepalived高可用

来源:互联网 发布:java单例模式添加数据 编辑:程序博客网 时间:2024/06/05 07:18

Keepalived简介

        keepalived是一款失效转发机制的软件, 基于VRRP协议来实现的WEB服务高可用方案,可以利用其来避免单点故障。它的作用是检测web服务器的状态,一个WEB服务至少会有2台服务器运行Keepalived,一台为主服务器(MASTER),一台为备份服务器(BACKUP),但是对外表现为一个虚拟IP,主服务器会发送特定的消息给备份服务器,当备份服务器收不到这个消息的时候,即主服务器宕机的时候,备份服务器就会接管虚拟IP,继续提供服务,从而保证了高可用性。

Keepalived工作机制

        在一个VRRP虚拟路由器中,有多台物理的VRRP路由器,但是这多台的物理的机器并不能同时工作,而是由一台称为MASTER的负责路由工作,其它的都是BACKUP,MASTER并非一成不变,VRRP让每个VRRP路由器参与竞选,最终获胜的就是MASTER。MASTER拥有一些特权,比如拥有虚拟路由器的IP地址,我们的主机就是用这个IP地址作为静态路由的。拥有特权的MASTER要负责转发发送给网关地址的包和响应ARP请求。

        VRRP通过竞选协议来实现虚拟路由器的功能,所有的协议报文都是通过IP多播(multicast)包(多播地址224.0.0.18)形式发送的。虚拟路由器由VRID(范围0-255)和一组IP地址组成,对外表现为一个周知的MAC地址。所以,在一个虚拟路由器中,不管谁是MASTER,对外都是相同的MAC和IP(称之为VIP)。客户端主机并不需要因为MASTER的改变而修改自己的路由配置,对他们来说,这种主从的切换是透明的。

        在一个虚拟路由器中,只有作为MASTER的VRRP路由器会一直发送VRRP广告包(VRRPAdvertisement message),BACKUP不会抢占MASTER,除非它的优先级(priority)更高。当MASTER不可用时(BACKUP收不到广告包), 多台BACKUP中优先级最高的这台会被抢占为MASTER。这种抢占是非常快速的(<1s),以保证服务的连续性。
由于安全性考虑,VRRP包使用了加密协议进行加密。

初始化

       路由器启动时,如果路由器的优先级是255(最高优先级,路由器拥有路由器地址),要发送VRRP通告信息,并发送广播ARP信息通告路由器IP地址对应的MAC地址为路由虚拟MAC,设置通告信息定时器准备定时发送VRRP通告信息,转为MASTER状态;否则进入BACKUP状态,设置定时器检查定时检查是否收到MASTER的通告信息。


MASTER服务器

主机状态下的路由器要完成如下功能:
设置定时通告定时器;
用VRRP虚拟MAC地址响应路由器IP地址的ARP请求;
转发目的MAC是VRRP虚拟MAC的数据包;
如果是虚拟路由器IP的拥有者,将接受目的地址是虚拟路由器IP的数据包,否则丢弃;
当收到shutdown的事件时删除定时通告定时器,发送优先权级为0的通告包,转初始化状态;
如果定时通告定时器超时时,发送VRRP通告信息;
收到VRRP通告信息时,如果优先权为0,发送VRRP通告信息;否则判断数据的优先级是否高于本机,或相等而且实际IP地址大于本地实际IP,设置定时通告定时器,复位主机超时定时器,转BACKUP状态;否则的话,丢弃该通告包;


BACKUP服务器
备机状态下的路由器要实现以下功能:
设置主机超时定时器;
不能响应针对虚拟路由器IP的ARP请求信息;
丢弃所有目的MAC地址是虚拟路由器MAC地址的数据包;
不接受目的是虚拟路由器IP的所有数据包;
当收到shutdown的事件时删除主机超时定时器,转初始化状态;
主机超时定时器超时的时候,发送VRRP通告信息,广播ARP地址信息,转MASTER状态;

收到VRRP通告信息时,如果优先权为0,表示进入MASTER选举;否则判断数据的优先级是否高于本机,如果高的话承认MASTER有效,复位主机超时定时器;否则的话,丢弃该通告包;


ARP查询处理

       当内部主机通过ARP查询虚拟路由器IP地址对应的MAC地址时,MASTER路由器回复的MAC地址为虚拟的VRRP的MAC地址,而不是实际网卡的 MAC地址,这样在路由器切换时让内网机器觉察不到;而在路由器重新启动时,不能主动发送本机网卡的实际MAC地址。如果虚拟路由器开启的ARP代理 (proxy_arp)功能,代理的ARP回应也回应VRRP虚拟MAC地址;


安装Keepalived


下载地址:http://www.keepalived.org/download.html
安装keepalived依赖组件:yum install -y openssl-devel opensslyum install -y popt-devel编译安装:tar zxvf keepalived-1.2.19.tar.gzcd keepalived-1.2.19./configure --prefix=/usr/local/keepalivedmake && make install配置为服务:cp /usr/local/keepalived/etc/rc.d/init.d/keepalived /etc/rc.d/init.dcp /usr/local/keepalived/etc/sysconfig/keepalived /etc/sysconfig/mkdir /etc/keepalivedcp /usr/local/keepalived/etc/keepalived/keepalived.conf /etc/keepalived/cp /usr/local/keepalived/sbin/keepalived /usr/sbin/ 可以这样启动/停止:service keepalived start|stop|reload|restart|condrestart|status设为开机启动:chkconfig keepalived on查看keepalived日志:tail -f  /var/log/message

keepalived+flume搭建高可用采集框架

下面以keepalived+flume为例,通过keepalived虚拟ip搭建Flume的高可用框架:
主服务器IP:10.0.1.68
从服务器IP:10.0.1.69
虚拟IP:10.0.1.71
主从服务器分别安装Nginx 和 Keepalived,可以将网站的域名解析到虚拟IP:10.0.1.254,这样主从服务器可以轮流的接管该虚拟IP,保证网站正常的对外访问。
主服务器(10.0.1.68)Keepalived的配置:
[root@testcluster68 data]# cat /etc/keepalived/keepalived.conf ! Configuration File for keepalivedglobal_defs {   notification_email {517894513@qq.com#这里可以定义多个报警邮箱   }   notification_email_from 516973786@qq.com   smtp_server smtp.qq.com   smtp_connect_timeout 30   router_id LVS_DEVEL}vrrp_script check_port {   script "/data/check_port.sh"   interval 2     #检测的间隔   weight 2     #如果脚本执行结果非0,并且weight配置的值小于0,则优先级相应的减少;如果脚本执行结果为0,并且weight配置的值大于0,则优先级相应的增加;其他情况,维持原本prority的优先级。}vrrp_instance VI_1 {    state MASTER     #显示定义为主服务器    interface eth0   #绑定的网口,该网口即上面提到的两个IP的接口    virtual_router_id 51     #定义的ID,官方的是 51,主从服务器必须一致    mcast_src_ip 10.0.1.68   #主服务器的IP    priority 100    #优先级,任意定义,但是一定要比从服务器高    advert_int 1    #VRRP Multicast 广播周期秒数    authentication {        auth_type PASS        auth_pass 1111    }    virtual_ipaddress {    #绑定的虚IP        10.0.1.71    }    track_script {        check_port    #调用检测脚本    }}

从服务器(10.0.1.69)Keepalived的配置:
[root@testcluster69 data]# vi /etc/keepalived/keepalived.conf ! Configuration File for keepalivedglobal_defs {   notification_email {        517894513@qq.com    #这里可以定义多个报警邮箱   }   notification_email_from 516973786@qq.com  #报警人   smtp_server smtp.qq.com   smtp_connect_timeout 30   router_id LVS_DEVEL}vrrp_script check_port {   script "/data/check_port.sh"   interval 2    #检测的间隔   weight 2      #如果脚本执行结果非0,并且weight配置的值小于0,则优先级相应的减少;如果脚本执行结果为0,并且weight配置的值大于0,则优先级相应的增加;其他情况,维持原本prority的优先级。}vrrp_instance VI_1 {    state BACKUP     #显示定义为从服务器    interface eth0   #绑定的网口,该网口即上面提到的两个IP的接口    virtual_router_id 51     #定义的ID,官方的是 51,主从服务器必须一致    mcast_src_ip 10.0.1.69   #从服务器的IP    priority 100     #优先级,任意定义,但是一定要比从服务器高    advert_int 1     #VRRP Multicast 广播周期秒数    authentication {        auth_type PASS        auth_pass 1111    }    virtual_ipaddress {   #绑定的虚IP        10.0.1.71    }    track_script {        check_port     #调用检测脚本    }}

主从服务器的check_port.sh脚本:
这是脚本检查flume进程是否存在,如果不存在就killall keepalived,来达到主从切换的作用,这样keepalived的Backup服务器就无法收到Master服务器的消息,就会促使Backup服务器选举出Master服务器。
[root@testcluster68 data]# cat check_port.sh #!/bin/bashN=`ps aux|grep flume | grep -v grep | wc -l`if [ $N -eq 0 ];then   killall keepalivedfi<pre name="code" class="java">[root@testcluster68 data]# chmod 755 check_port.sh修改成可执行的文件。
启动主从服务器后,查看主服务器的IP情况:
[root@testcluster68 ~]# /sbin/ip a1: lo: <LOOPBACK,UP,LOWER_UP> mtu 16436 qdisc noqueue state UNKNOWN     link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00    inet 127.0.0.1/8 scope host lo    inet6 ::1/128 scope host        valid_lft forever preferred_lft forever2: eth0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000    link/ether 74:d4:35:2e:dd:9b brd ff:ff:ff:ff:ff:ff    inet 10.0.1.68/24 brd 10.0.1.255 scope global eth0    inet 10.0.1.71/32 scope global eth0    inet6 fe80::76d4:35ff:fe2e:dd9b/64 scope link        valid_lft forever preferred_lft forever

查看从服务器的IP情况:
[root@testcluster69 ~]# /sbin/ip a1: lo: <LOOPBACK,UP,LOWER_UP> mtu 16436 qdisc noqueue state UNKNOWN     link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00    inet 127.0.0.1/8 scope host lo    inet6 ::1/128 scope host        valid_lft forever preferred_lft forever2: eth0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000    link/ether 74:d4:35:2e:dd:92 brd ff:ff:ff:ff:ff:ff    inet 10.0.1.69/24 brd 10.0.1.255 scope global eth0    inet6 fe80::76d4:35ff:fe2e:dd92/64 scope link        valid_lft forever preferred_lft forever
可见虚拟IP已经绑定到10.0.1.68。


现在我们关闭主服务器的Flume进程,查看主服务器的虚拟IP变化:
[root@testcluster68 ~]# /sbin/ip a1: lo: <LOOPBACK,UP,LOWER_UP> mtu 16436 qdisc noqueue state UNKNOWN     link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00    inet 127.0.0.1/8 scope host lo    inet6 ::1/128 scope host        valid_lft forever preferred_lft forever2: eth0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000    link/ether 74:d4:35:2e:dd:9b brd ff:ff:ff:ff:ff:ff    inet 10.0.1.68/24 brd 10.0.1.255 scope global eth0    inet6 fe80::76d4:35ff:fe2e:dd9b/64 scope link        valid_lft forever preferred_lft forever
虚拟IP被移除,keepalived进程也被kill。

查看从服务器的虚拟IP变化:
[root@testcluster69 ~]# /sbin/ip a1: lo: <LOOPBACK,UP,LOWER_UP> mtu 16436 qdisc noqueue state UNKNOWN     link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00    inet 127.0.0.1/8 scope host lo    inet6 ::1/128 scope host        valid_lft forever preferred_lft forever2: eth0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000    link/ether 74:d4:35:2e:dd:92 brd ff:ff:ff:ff:ff:ff    inet 10.0.1.69/24 brd 10.0.1.255 scope global eth0    inet 10.0.1.71/32 scope global eth0    inet6 fe80::76d4:35ff:fe2e:dd92/64 scope link        valid_lft forever preferred_lft forever
从服务器挂载了虚拟IP

1 0
原创粉丝点击