keepalived实现服务高可用

来源：互联网发布：阅读杂志的软件编辑：程序博客网时间：2024/05/22 15:00

http://www.cnblogs.com/clsn/p/8052649.html

阅读目录

1.1 keepalived是什么？
1.2 keepalived服务的三个重要功能
1.3 Keepalived高可用故障切换转移原理
1.4 keepalived 原理
2.1 软件的部署
2.2 脑裂
2.3 如何进行脑裂情况监控
2.4 排错过程
2.5 更改nginx反向代理配置只监听vip地址
2.6 让keepalived监控nginx
2.7 多实例的配置
2.8 keepalived双主模式示意图

第1章 keepalived服务说明

回到顶部

1.1 keepalived是什么？

　　Keepalived软件起初是专为LVS负载均衡软件设计的，用来管理并监控LVS集群系统中各个服务节点的状态，后来又加入了可以实现高可用的VRRP功能。因此，Keepalived除了能够管理LVS软件外，还可以作为其他服务（例如：Nginx、Haproxy、MySQL等）的高可用解决方案软件。

　　Keepalived软件主要是通过VRRP协议实现高可用功能的。VRRP是Virtual Router RedundancyProtocol(虚拟路由器冗余协议）的缩写，VRRP出现的目的就是为了解决静态路由单点故障问题的，它能够保证当个别节点宕机时，整个网络可以不间断地运行。

　　所以，Keepalived 一方面具有配置管理LVS的功能，同时还具有对LVS下面节点进行健康检查的功能，另一方面也可实现系统网络服务的高可用功能。

keepalived官网http://www.keepalived.org

回到顶部

1.2 keepalived服务的三个重要功能

　　管理LVS负载均衡软件

　　实现LVS集群节点的健康检查中

　　作为系统网络服务的高可用性（failover）

回到顶部

1.3 Keepalived高可用故障切换转移原理

　　Keepalived高可用服务对之间的故障切换转移，是通过 VRRP (Virtual Router Redundancy Protocol ,虚拟路由器冗余协议）来实现的。

　　在 Keepalived服务正常工作时，主 Master节点会不断地向备节点发送（多播的方式）心跳消息，用以告诉备Backup节点自己还活看，当主 Master节点发生故障时，就无法发送心跳消息，备节点也就因此无法继续检测到来自主 Master节点的心跳了，于是调用自身的接管程序，接管主Master节点的 IP资源及服务。而当主 Master节点恢复时，备Backup节点又会释放主节点故障时自身接管的IP资源及服务，恢复到原来的备用角色。

　　那么，什么是VRRP呢？

　　VRRP ,全称 Virtual Router Redundancy Protocol ,中文名为虚拟路由冗余协议，VRRP的出现就是为了解决静态踣甶的单点故障问题，VRRP是通过一种竞选机制来将路由的任务交给某台VRRP路由器的。

回到顶部

1.4 keepalived 原理

1.4.1keepalived高可用架构示意图

1.4.2 文字，表述

Keepalived的工作原理：

　　Keepalived高可用对之间是通过VRRP通信的，因此，我们从 VRRP开始了解起：

　　　　1) VRRP,全称 Virtual Router Redundancy Protocol,中文名为虚拟路由冗余协议，VRRP的出现是为了解决静态路由的单点故障。

　　　　2) VRRP是通过一种竟选协议机制来将路由任务交给某台 VRRP路由器的。

　　　　3) VRRP用 IP多播的方式（默认多播地址（224.0_0.18))实现高可用对之间通信。

　　　　4) 工作时主节点发包，备节点接包，当备节点接收不到主节点发的数据包的时候，就启动接管程序接管主节点的开源。备节点可以有多个，通过优先级竞选，但一般 Keepalived系统运维工作中都是一对。

　　　　5) VRRP使用了加密协议加密数据，但Keepalived官方目前还是推荐用明文的方式配置认证类型和密码。

　　介绍完 VRRP,接下来我再介绍一下 Keepalived服务的工作原理：

　　Keepalived高可用对之间是通过 VRRP进行通信的， VRRP是遑过竞选机制来确定主备的，主的优先级高于备，因此，工作时主会优先获得所有的资源，备节点处于等待状态，当主挂了的时候，备节点就会接管主节点的资源，然后顶替主节点对外提供服务。

　　在 Keepalived服务对之间，只有作为主的服务器会一直发送 VRRP广播包,告诉备它还活着，此时备不会枪占主，当主不可用时，即备监听不到主发送的广播包时，就会启动相关服务接管资源，保证业务的连续性.接管速度最快可以小于1秒。

第2章 keepalived软件使用

回到顶部

2.1 软件的部署

2.1.1 第一个里程碑 keepalived软件安装

yum install keepalived -y

/etc/keepalived/etc/keepalived/keepalived.conf     #keepalived服务主配置文件/etc/rc.d/init.d/keepalived         #服务启动脚本/etc/sysconfig/keepalived/usr/bin/genhash/usr/libexec/keepalived/usr/sbin/keepalived

第二个里程碑：进行默认配置测试

2.1.2 配置文件说明

1-13行表示全局配置

 global_defs {    #全局配置    notification_email {   定义报警邮件地址      acassen@firewall.loc      failover@firewall.loc      sysadmin@firewall.loc    }     notification_email_from Alexandre.Cassen@firewall.loc  #定义发送邮件的地址    smtp_server 192.168.200.1   #邮箱服务器     smtp_connect_timeout 30      #定义超时时间    router_id LVS_DEVEL        #定义路由标识信息，相同局域网唯一 }

15-30行虚拟ip配置 brrp

vrrp_instance VI_1 {   #定义实例    state MASTER         #状态参数 master/backup 只是说明    interface eth0       #虚IP地址放置的网卡位置    virtual_router_id 51 #同一家族要一直，同一个集群id一致    priority 100         # 优先级决定是主还是备    越大越优先    advert_int 1        #主备通讯时间间隔    authentication {     # ↓        auth_type PASS    #↓        auth_pass 1111    #认证    }                        #↑     virtual_ipaddress {  #↓        192.168.200.16    设备之间使用的虚拟ip地址        192.168.200.17        192.168.200.18    }}

配置管理LVS

　　关于 LVS 详情参考 http://www.cnblogs.com/clsn/p/7920637.html#_label7

2.1.3 最终配置文件

主负载均衡服务器配置

[root@lb01 conf]# cat  /etc/keepalived/keepalived.conf ! Configuration File for keepalivedglobal_defs {   router_id lb01}vrrp_instance VI_1 {    state MASTER    interface eth0    virtual_router_id 51    priority 150    advert_int 1    authentication {        auth_type PASS        auth_pass 1111    }    virtual_ipaddress {        10.0.0.3    }}

备负载均衡服务器配置

[root@lb02 ~]# cat /etc/keepalived/keepalived.conf ! Configuration File for keepalivedglobal_defs {   router_id lb02}vrrp_instance VI_1 {    state BACKUP    interface eth0    virtual_router_id 51    priority 100    advert_int 1    authentication {        auth_type PASS        auth_pass 1111    }    virtual_ipaddress {     10.0.0.3    }}

2.1.4 启动keepalived

[root@lb02 ~]# /etc/init.d/keepalived startStarting keepalived:                                       [  OK  ]

2.1.5 【说明】在进行访问测试之前要保证后端的节点都能够单独的访问。

测试连通性. 后端节点

[root@lb01 conf]# curl -H host:www.etiantian.org  10.0.0.8web01 www[root@lb01 conf]# curl -H host:www.etiantian.org  10.0.0.7web02 www[root@lb01 conf]# curl -H host:www.etiantian.org  10.0.0.9web03 www[root@lb01 conf]# curl -H host:bbs.etiantian.org  10.0.0.9web03 bbs[root@lb01 conf]# curl -H host:bbs.etiantian.org  10.0.0.8web01 bbs[root@lb01 conf]# curl -H host:bbs.etiantian.org  10.0.0.7web02 bbs

2.1.6 查看虚拟ip状态

[root@lb01 conf]# ip a1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN     link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00    inet 127.0.0.1/8 scope host lo    inet6 ::1/128 scope host        valid_lft forever preferred_lft forever2: eth0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000    link/ether 00:0c:29:90:7f:0d brd ff:ff:ff:ff:ff:ff    inet 10.0.0.5/24 brd 10.0.0.255 scope global eth0    inet 10.0.0.3/24 scope global secondary eth0:1    inet6 fe80::20c:29ff:fe90:7f0d/64 scope link        valid_lft forever preferred_lft forever3: eth1: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000    link/ether 00:0c:29:90:7f:17 brd ff:ff:ff:ff:ff:ff    inet 172.16.1.5/24 brd 172.16.1.255 scope global eth1    inet6 fe80::20c:29ff:fe90:7f17/64 scope link        valid_lft forever preferred_lft forever

2.1.7 【总结】配置文件修改

　　Keepalived主备配置文件区别：

　　　　01. router_id 信息不一致

　　　　02. state 状态描述信息不一致

　　　　03. priority 主备竞选优先级数值不一致

回到顶部

2.2 脑裂

　　在高可用（HA）系统中，当联系2个节点的“心跳线”断开时，本来为一整体、动作协调的HA系统，就分裂成为2个独立的个体。由于相互失去了联系，都以为是对方出了故障。两个节点上的HA软件像“裂脑人”一样，争抢“共享资源”、争起“应用服务”，就会发生严重后果——或者共享资源被瓜分、2边“服务”都起不来了；或者2边“服务”都起来了，但同时读写“共享存储”，导致数据损坏（常见如数据库轮询着的联机日志出错）。

　　对付HA系统“裂脑”的对策，目前达成共识的的大概有以下几条：

　　　　1）添加冗余的心跳线，例如：双线条线（心跳线也HA），尽量减少“裂脑”发生几率；

　　　　2）启用磁盘锁。正在服务一方锁住共享磁盘，“裂脑”发生时，让对方完全“抢不走”共享磁盘资源。但使用锁磁盘也会有一个不小的问题，如果占用共享盘的一方不主动“解锁”，另一方就永远得不到共享磁盘。现实中假如服务节点突然死机或崩溃，就不可能执行解锁命令。后备节点也就接管不了共享资源和应用服务。于是有人在HA中设计了“智能”锁。即：正在服务的一方只在发现心跳线全部断开（察觉不到对端）时才启用磁盘锁。平时就不上锁了。

　　　　3）设置仲裁机制。例如设置参考IP（如网关IP），当心跳线完全断开时，2个节点都各自ping一下参考IP，不通则表明断点就出在本端。不仅“心跳”、还兼对外“服务”的本端网络链路断了，即使启动（或继续）应用服务也没有用了，那就主动放弃竞争，让能够ping通参考IP的一端去起服务。更保险一些，ping不通参考IP的一方干脆就自我重启，以彻底释放有可能还占用着的那些共享资源。

2.2.1 脑裂产生的原因

　　一般来说，裂脑的发生，有以下几种原因：

阅读全文

0 0

阅读杂志的软件

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子安徽穷吗安徽崛起安徽市安徽市排名安徽经济安徽教育武汉到安徽安徽名人安徽风景安徽招聘网安徽公务员安徽美食安徽女人安徽国税安徽公司安徽省省长安徽省联社安徽的六安安徽九华山安徽合肥安徽的安徽省省会安徽滁州安徽有什么安徽中安徽鲜花店安徽公司安徽帮安徽百慕大河南安徽江苏安徽安徽好吗南昌安徽湖南安徽安徽河南安徽多少市安徽的公司南京安徽安徽的旅游安徽宿州浙江安徽