xingyu655 发表于 2018-12-29 12:21:03

高可用之Keepalived详解

  原理简介
  keepalived顾名思义是保持存活,常用来搭建设备的高可用,防止业务核心设备出现单点故障。keepalived基于VRRP协议来实现高可用,主要用作realserver的健康检查以及负载均衡主机和backup主机之间的故障漂移。如果将TCP/IP划分为5层,则Keepalived就是一个类似于3~5层交换机制的软件,具有3~5层交换功能。
  其主要作用是检测服务器的状态,如果有一台web服务器死机,或工作出现故障,Keepalived将检测到,并将有故障的服务器从系统中剔除,同时使用其他服务器代替该服务器的工作,当服务器工作正常后Keepalived自动将服务器加入到服务器群中,实现自动剔除与恢复,不需要人工干涉,需要人工做的只是修复故障的服务器。
  三层机理是发送ICMP数据包即PING给某台服务器,如果不通,则认为其故障,并从服务器群中剔除;四层机理是检测TCP端口号状态来判断某台服务器是否故障,如果检测端口存在异常,则从服务器群中剔除;五层机理是根据用户的设定检查某个服务器应用程序是否正常运行,如果不正常,则从服务器群中剔除。


  安装

  搞定依赖包:

  # yum -y install kernel-devel openssl-devel popt-devel
  下载keeplived:http://www.keepalived.org/software/keepalived-1.2.12.tar.gz
  tar解包并且进入目录后执行
  # ./configure --prefix=/ --with-kernel-dir=/usr/src/kernels/2.6.18-194.el5-i686 #进行配置,红色地方用table键补全。指定到/,配置文件会自动放到目录下,方便使用
  必须看到以下提示,说明配置正确,才能继续安装。
  Use IPVS Framework : Yes
  IPVS sync daemon support : Yes
  Use VRRP Framework       : Yes
  # make && make install                            #编译并安装
  安装好后用chkconfig设为开机自动启动。
  

  配置文件详解
  keepalived配置项分为三类。全局配置、vrrpd配置、LVS配置(有LVS时用)
  # vi keepalived.conf
  ! Configuration File for keepalived
  
  global_defs {
     notification_email {         #指定keep在发生事件时,需要发送email到对象
     sunny_jyd@163.com         #设置报警邮件地址,可以设置多个,每行一个。注意,如果要开启邮件报警,需要开启本机的sendmail服务
     }
     notification_email_from root@example.com       #设置邮件的发送地址
     smtp_server 127.0.0.1                  #设置email的smtp服务器地址
     smtp_connect_timeout 30                   #设置连接 smtp 服务器超时时间
     router_id KeepMASTER                     #运行 Keepalived服务器的一个标识。发邮件时显示在邮件标题中的信息
  }
  
  notify_master "…"                   #进入(切换到)Master状态时要执行的脚本,可以是状态报警,也可是服务管理。格式为 $1脚本,可选$2group或 instance名,$3Master等状态
  notify_backup "…"      #进入Backup状态时要执行的脚本,可以是状态报警,也可是服务管理
  notify_fault "…"         #进入fault状态时要执行的脚本,可以是状态报警,也可是服务管理
  notify_stop "…"                 #进入stop状态时要执行的脚本,可以是状态报警,也可是服务管理
  vrrp_sync_group G1 {       #不同网段的服务器定义为不同组。内外网都开启VRRP实例,配的只查内网,外网挂了,VRRPD仍认为自己健康,不会切换。把内外网实例都放在sync_group,任何实例故障都能切换。
  group {
   VI-1            #实例名
  }
  
  vrrp_instance VI_1 {            #vrrp实例定义部分         
      state MASTER                   #指定 Keepalived 的角色,MASTER表示此主机是主用服务器,BACKUP表示是备用服务器。备份服务器上将 MASTER 改为 BACKUP。
      interface eth0               #指定 HA监测网络的接口
      virtual_router_id 51         #虚拟路由标识,这个标识是一个数字,并且同一个 vrrp 实例使用唯一的标识,即同一个 vrrp_instance下,MASTER 和 BACKUP必须是一致的。(0-255)
  # garp_master_delay 1                   #主从切换时间秒
      priority 100                   #定义优先级,数字越大,优先级越高,在一个 vrrp_instance下,MASTER的优先级必须大于 BACKUP 的优先级。备份服务上将 100 改为 50
      advert_int 1                   #设定MASTER 与 BACKUP负载均衡器之间同步检查的时间间隔,单位是秒
     nopreempt                      #不抢占功能,故障修复后不会抢占,提升实时性和稳定性。这个配置只能设置在stat为backup的主机上,而且这个主机的priority必须比另一台高。
      authentication {            #设定验证类型和密码
        auth_type PASS         #设置验证类型,主要有 PASS和 AH 两种
        auth_pass 1111         #设置验证密码,在一个 vrrp_instance下,MASTER 与 BACKUP必须使用相同的密码才能正常通信。
      }
  #track_interface {                #设置额外的监控,里面那个网卡出现问题都会切换
  # eth0
  #}
      virtual_ipaddress {            #设置虚拟 IP地址,可以设置多个虚拟IP地址,每行一个
        192.168.200.254/24 dev eth0
      }
  #virtual_route { }                #发生切换时,添加/删除路由
  }
  
  #虚拟服务器定义部分
  #virtual_server_group{                   #虚拟主机组,可选,让一台realserver上的某个server可以属于多个virtual_server,并且只做一次健康检查
  #vip port
  #   fwmark
  #}
  virtual_server 192.168.200.254 80 {                  #设置虚拟服务器,需要指定虚拟 ip 地址和服务端口,ip 与端口之间用空格隔开。
      delay_loop 6                     #设置健康检查时间,单位是秒
      lb_algo rr                         #设置负载调度算法,这里设置为 rr,即轮询算法,rr |wrr | lc |wlc |lblc |sh |dh
      lb_kind DR                   #设置 LVS实现负载均衡的机制,可以有 NAT、TUN 和 DR三个模式可选。      
  #persistence_timeout 20                                                   #回话保持时间(秒)
  #persistence_granularity            #LVS会话保持颗粒度
      protocol TCP                     #指定转发协议类型,有 tcp和 udp 两种
  #   virtualhost                                                #HTTP_GET做健康检查时,监察web服务器的虚拟主机(即HOST:头)
      real_server 192.168.200.103 80 {             #配置服务节点 1,需要指定 real server 的真实IP地址和端口,ip 与端口之间用空格隔开。
         weight 1                   #配置服务节点的权值,权值大小用数字表示,数字越大,权值越高,设置权值的大小可以为不同性能的服务器分配不同的负载,可以对性能高的服务器设置较高的权值,而对性能较低的服务器设置相对较低的权值,合理利用系统资源
  #    inhibit_on_failure                                           #在健康检查失败挂了后,吧weight调为0,而不是在ipvsadm中删。
  #    notify_up(down) “”                                   #检测到服务up或down时执行的脚本
  #健康检查的方式:HTTP_GET | SSL_GET | TCP_CHECK | SMTP_CHECK |MISC_CHECK
        TCP_CHECK {                  #realserve 的状态检测设置部分,单位是秒
              connect_timeout 10            #10秒无响应超时
              nb_get_retry 3            #重试次数
              delay_before_retry 3      #重试间隔
              connect_port 80         #测试连接的端口
        }
      }
      real_server 192.168.200.104 80 {    #配置服务节点 2,省略……
        weight 1
        TCP_CHECK {
              connect_timeout 10
              nb_get_retry 3
              delay_before_retry 3
              connect_port 80
        }
      }
  }
  
  vrrp_script check_httpd {            #对集群中某服务进行监控。这里为httpd
  #script “killall -0 httpd”            #通过killall命令检测,-0参数为对程序监控。关闭或异常则返回状态码1。
  script “
页: [1]
查看完整版本: 高可用之Keepalived详解