目的: 学习nginx + keepalive结合实现双机热备。
【实现图】
【环境】
master系统配置:
[root@master html]# ifconfig |grep -A 1 eth0
eth0 Link encap:Ethernet HWaddr 00:0C:29:65:14:0F
inet addr:192.168.100.10 Bcast:192.168.100.255 Mask:255.255.255.0
[root@master html]# hostname
master
[root@master html]# ifconfig |grep -A 1 eth0
eth0 Link encap:Ethernet HWaddr 00:0C:29:65:14:0F
inet addr:192.168.100.10 Bcast:192.168.100.255 Mask:255.255.255.0
[root@master html]# cat /etc/issue | head -1
entOS release 6.4 (Final)
master nginx提前web环境:
[root@master html]# curl 192.168.100.10
<!DOCTYPE html>
<html>
<h1>192.168.100.10 -- lnmp master -- bbs.test.com</h1>
</html>
slave系统配置:
[root@master ~]# ifconfig |grep -A 2 eth0
eth0 Link encap:Ethernet HWaddr 00:0C:29:65:14:0F
inet addr:192.168.100.10 Bcast:192.168.100.255 Mask:255.255.255.0
inet6 addr: fe80::20c:29ff:fe65:140f/64 Scope:Link
[root@master ~]# hostname
master
[root@master ~]# ifconfig |grep -A 1 eth0
eth0 Link encap:Ethernet HWaddr 00:0C:29:65:14:0F
inet addr:192.168.100.10 Bcast:192.168.100.255 Mask:255.255.255.0
[root@master ~]# head -1 /etc/issue
entOS release 6.4 (Final)
slave nginx配置:
[root@slave ~]# curl 192.168.100.13
<!DOCTYPE html>
<html>
<h1>192.168.100.13 -- lnmp slave -- bbs.test.com</h1>
</html>
【安装keepalive】
yum install keepalived
keepalived-1.2.13-5.el6_6.x86_64
版本号:
[root@master html]# keepalived -v
Keepalived v1.2.13 (03/19,2015)
安装的重要文件:
/etc/keepalived #配置文件目录
/etc/keepalived/keepalived.conf #配置文件
/etc/rc.d/init.d/keepalived #启动文件
/etc/sysconfig/keepalived #keepalived的系统初识化文件
/usr/bin/genhash #不知道 hash相关的吧
/usr/sbin/keepalived #keepalived的可执行文件
【配置文件的编写】
去除默认的配置文件
> /etc/keepalived/keepalived.conf
master配置配置文件
! Configuration File for keepalived
#core的定义
global_defs {
notification_email {
735896273@qq.com
}
notification_email_from andy@126.com
smtp_server 127.0.0.1
smtp_connect_timeout 30
router_id LVS_DEVEL
}
#定义检查脚本
vrrp_script check_http {
script "/root/check_nginx.sh" # verify the pid existance
interval 2 # check every 2 seconds
weight 2 # add 2 points of prio if OK 如果检测监本是成功的则优先级加2
}
#配置实例
vrrp_instance VI_1 {
state MASTER #主机为MASTER,备用机为BACKUP
interface eth0 #interface to monitor #HA监测网络接口
virtual_router_id 51 # Assign one ID for this route 主、备机的virtual_router_id必须相同
priority 101 # 101 on master,100 on backup
nopreempt #非抢占(因为默认如果master挂了,backup顶上去,即使master恢复也不抢占!
debug
authentication {
auth_type PASS ##VRRP认证方式
auth_pass mynginx #密码为mynginx
}
#VIP地址
virtual_ipaddress {
192.168.100.12
}
track_script {
check_http (调用nginx进程检测脚本)
}
}
###############check_http的脚本
[root@master html]# cat /root/check_nginx.sh
#!/bin/bashA=`ps -C nginx --no-header | wc -l`if [ $A -eq 0 ];then /etc/init.d/nginx start sleep 3 if [ `ps -C nginx --no-header | wc -l` -eq 0 ];then killall keepalived fifi
当检测到nginx进程不存在的时候,就干掉所有的keepalived,这时候,请求将会由keepalived的backup接管!!
注意: 脚本一定要有执行权限
chmod +x /root/check_nginx.sh
slave配置配置文件:
......
......
state BACKUP #主机为MASTER,备用机为BACKUP
...
priority 100
【启动】
master和slave 的keepalive和nginx都启动
/etc/init.d/keepalived start
/etc/init.d/nignx start
此时可以看到vip在master机器行,因为优先级高
[root@master html]# ip addr show eth0
2: eth0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP qlen 1000
link/ether 00:0c:29:65:14:0f brd ff:ff:ff:ff:ff:ff
inet 192.168.100.10/24 brd 192.168.100.255 scope global eth0
inet 192.168.100.12/32 scope global eth0
inet6 fe80::20c:29ff:fe65:140f/64 scope link
valid_lft forever preferred_lft forever
【会导致切换的情况】
1 master挂了(机器挂了或者keepalive进程没了),终归到底keepalive进程没了,此时会vrrp检查对端没包,此时backup接管VIP。
2 check_nginx.sh检查脚本,当检测到nginx进程挂了,且起不来的时候,就把keepalived全部杀掉。
这样当然,就切换到了backup咯。
【疑问】
1 抓包如何抓到vrrp包?
tcpdump -vvn |grep -i vrrp
可以看到优先级的详细信息。
或者通过指定vrr协议抓取
tcpdump -vnn vrrp
2 keepalive的日志如何弄?
tail -f /var/log/messages
3 非强制nopreempt好像不起作用。先关掉master的keepalivd再启动master 的keepalived和nginx,master依然会把VIP抢占古来
据说是非强占,只能在backup中起作用,即要将初识状态都设置成为backup,但是实验未成功。 这里不细细研究。
4 weight像没啥用?
在这个地方,确实没用。但是weight的只要脚本执行返回值为0(即echo $?为0就表示脚本执行成功),所以以上的哪个实验,master的pri优先级为101+2=103,backup的pri优先级为100+2=102。
其实上面切换的主要关键,是用到关闭keepalived。进行切换。
messgages可以看到的信息。
VRRP_Script(check_http) succeeded
5 检查时间
advert_int 1 #检查间隔,默认1秒
6 track_script其实就是用来检测nginx的。
简单VRRP的原理:
看vrrp包信息:
21:47:12.591586 IP (tos 0xc0, ttl 255, id 431, offset 0, flags [none], proto VRRP (112), length 40)
192.168.100.10 > 224.0.0.18: VRRPv2, Advertisement, vrid 51, prio 103, authtype simple, intvl 1s, length 20, addrs: 192.168.100.12 auth "mynginx^@"
是master通过组播地址224.0.0.18通告自己的route id和优先级。收到包的节点,并且认证通过的,比较自己和收到的优先级,进行选举新的mater。