设为首页 收藏本站
查看: 686|回复: 0

[经验分享] Redis集群redis主从自动切换Sentinel(哨兵模式)

[复制链接]

尚未签到

发表于 2018-11-4 09:28:38 | 显示全部楼层 |阅读模式
  Redis Sentinel
  Sentinel(哨兵)是用于监控redis集群中Master状态的工具,其已经被集成在redis2.4+的版本中
  一、Sentinel作用:
  1):Master状态检测
  2):如果Master异常,则会进行Master-Slave切换,将其中一个Slave作为Master,将之前的Master作为Slave
  3):Master-Slave切换后,master_redis.conf、slave_redis.conf和sentinel.conf的内容都会发生改变,即master_redis.conf中会多一行slaveof的配置,sentinel.conf的监控目标会随之调换
  二、Sentinel工作方式:
  1):每个Sentinel以每秒钟一次的频率向它所知的Master,Slave以及其他 Sentinel 实例发送一个 PING 命令
  2):如果一个实例(instance)距离最后一次有效回复PING 命令的时间超过 down-after-milliseconds 选项所指定的值, 则这个实例会被 Sentinel 标记为主观下线。
  3):如果一个Master被标记为主观下线,则正在监视这个Master的所有 Sentinel 要以每秒一次的频率确认Master的确进入了主观下线状态。
  4):当有足够数量的 Sentinel(大于等于配置文件指定的值)在指定的时间范围内确认Master的确进入了主观下线状态, 则Master会被标记为客观下线
  5):在一般情况下, 每个 Sentinel 会以每 10 秒一次的频率向它已知的所有Master,Slave发送 INFO 命令
  6):当Master被 Sentinel 标记为客观下线时,Sentinel 向下线的 Master 的所有 Slave 发送 INFO 命令的频率会从 10 秒一次改为每秒一次
  7):若没有足够数量的 Sentinel 同意 Master 已经下线, Master 的客观下线状态就会被移除。
  若 Master 重新向 Sentinel 的 PING 命令返回有效回复, Master 的主观下线状态就会被移除。
  主观下线和客观下线
  主观下线:Subjectively Down,简称 SDOWN,指的是当前 Sentinel 实例对某个redis服务器做出的下线判断。
  客观下线:Objectively Down, 简称 ODOWN,指的是多个 Sentinel 实例在对Master Server做出 SDOWN 判断,并且通过 SENTINEL is-master-down-by-addr 命令互相交流之后,得出的Master Server下线判断,然后开启failover.
  SDOWN适合于Master和Slave,只要一个 Sentinel 发现Master进入了ODOWN, 这个 Sentinel 就可能会被其他 Sentinel 推选出, 并对下线的主服务器执行自动故障迁移操作。
  ODOWN只适用于Master,对于Slave的 Redis 实例,Sentinel 在将它们判断为下线前不需要进行协商,所以Slave的 Sentinel 永远不会达到ODOWN。
  三、配置:
  1:指定监听Master(三个节点)
  # vi /main/redis/sentinel_26379.conf
  port 26379
  daemonize yes
  dir /tmp
  logfile "/var/log/redis_26382.log"
  sentinel monitor mymaster 127.0.0.1 6379 2
  sentinel down-after-milliseconds mymaster 30000
  sentinel parallel-syncs mymaster 1
  sentinel failover-timeout mymaster 900000
  # vi /main/redis/sentinel_26381.conf
  port 26381
  daemonize yes
  dir /tmp
  logfile "/var/log/redis_26382.log"
  sentinel monitor mymaster 127.0.0.1 6379 2
  sentinel down-after-milliseconds mymaster 30000
  sentinel parallel-syncs mymaster 1
  sentinel failover-timeout mymaster 900000
  # vi /main/redis/sentinel_26382.conf
  port 26382
  daemonize yes
  dir /tmp
  logfile "/var/log/redis_26382.log"
  sentinel monitor mymaster 127.0.0.1 6379 2
  sentinel down-after-milliseconds mymaster 30000
  sentinel parallel-syncs mymaster 1
  sentinel failover-timeout mymaster 900000
  #上面配置文件说明如下:
  ####
  port 5000#sentinel
  #监听的端口
  sentinel monitor mymaster192.168.241.150 9400 2  
  #192.168.241.150是master redis的IP地址和端口,2是代表2个sentinel检测到异常,才判断是real fail. Mymaster主机组的名称可以随便定义
  sentinel down-after-millisecondsmymaster 30000      #指定sentinel监控到redis实例持续异常多长时间后,会判决其状态为down。若实际业务需要sentinel尽快判决出redis实例异常,则可适当配小,单位是毫秒
  sentinel can-failover mymaster yes                   #在sentinel检测到O_DOWN后,是否对这台redis启动failover机制
  sentinel parallel-syncs mymaster 1                   #执行故障转移时,最多可以有多少个从服务器同时对新的主服务器进行同步,这个数字越小,完成故障转移所需的时间就越长,但越大就意味着越多的从服务器因为复制而不可用。可以通过将这个值设为 1 来保证每次只有一个从服务器处于不能处理命令请求的状态。
  sentinel failover-timeout mymaster900000            #若sentinel在该配置值内未能完成failover操作(即故障时master/slave自动切换),则认为本次failover失败
  sentinel auth-pass master1rot@minunix               #当redis访问都需要密码的时候,即在redis.conf有配置requirepass项的时候,需要定义此项
  sentinel notification-script master1/data/scripts/send_mail.sh
  #当sentinel触发时,切换主从状态时,需要执行的脚本。当主down的时候可以通知当事人,
  2:启动sentinel(三个节点):
  # redis-sentinel /etc/redis/sentinel_26379.conf
  # redis-sentinel /etc/redis/sentinel_26381.conf
  # redis-sentinel /etc/redis/sentinel_26382.conf
  注意,必须使用redis-sentinel命令启动sentinel_26379.conf,虽然redis-sentinel是redis-server的软连接。
  启动sentinel后,查看sentinel_26379.conf、sentinel_26380.conf、sentinel_26381.conf
  可发现配置文件会记录已经加入的集群节点,并且配置文件内容改变了:
  [root@localhost redis]# cat sentinel-26379.conf
  port 26379
  daemonize yes
  pidfile "/var/run/redis-26379.pid"
  logfile "/var/log/redis_26379.log"
  dir "/tmp"
  sentinel monitor mymaster 127.0.0.1 6379 2
  sentinel config-epoch mymaster 0
  sentinel leader-epoch mymaster 0
  sentinel known-slave mymaster 127.0.0.1 6382
  # Generated by CONFIG REWRITE
  sentinel known-slave mymaster 127.0.0.1 6381
  sentinel known-sentinel mymaster 127.0.0.1 263818fa3f71262abb6adfb838a598f449f855a9d4f3f
  sentinel known-sentinel mymaster 127.0.0.1 2638226f3c5cf596971dbf8c8ed112d015fa252f36a08
  sentinel current-epoch 0
  [root@localhost redis]# cat sentinel-26381.conf
  #master1
  port 26381
  daemonize yes
  pidfile "/var/run/redis-26381.pid"
  logfile "/var/log/redis_26381.log"
  dir "/tmp"
  sentinel monitor mymaster 127.0.0.1 6379 2
  sentinel config-epoch mymaster 0
  sentinel leader-epoch mymaster 0
  sentinel known-slave mymaster 127.0.0.1 6382
  # Generated by CONFIG REWRITE
  sentinel known-slave mymaster 127.0.0.1 6381
  sentinel known-sentinel mymaster 127.0.0.1 263798eb55903cd604571d4a816a2abfc6e7d60f9e356
  sentinel known-sentinel mymaster 127.0.0.1 2638226f3c5cf596971dbf8c8ed112d015fa252f36a08
  sentinel current-epoch 0
  [root@localhost redis]# cat sentinel-26382.conf
  #master1
  port 26382
  daemonize yes
  pidfile "/var/run/redis-26382.pid"
  logfile "/var/log/redis_26382.log"
  dir "/tmp"
  sentinel monitor mymaster 127.0.0.1 6379 2
  sentinel config-epoch mymaster 0
  sentinel leader-epoch mymaster 0
  sentinel known-slave mymaster 127.0.0.1 6381
  # Generated by CONFIG REWRITE
  sentinel known-slave mymaster 127.0.0.1 6382
  sentinel known-sentinel mymaster 127.0.0.1 263818fa3f71262abb6adfb838a598f449f855a9d4f3f
  sentinel known-sentinel mymaster 127.0.0.1 263798eb55903cd604571d4a816a2abfc6e7d60f9e356
  sentinel current-epoch 0
  查看启动状态:
  [root@localhost redis]# ps -ef |grep redis
  root      2630     1  016:41 ?        00:00:03 redis-server*:6379
  root      2645     1  016:46 ?        00:00:02 redis-server*:6381
  root      2650     1  016:46 ?        00:00:02 redis-server*:6382
  root      2705     1  017:13 ?        00:00:02 redis-sentinel*:26379 [sentinel]
  root      2724  2276  017:22 pts/1    00:00:00 tail -f/var/log/redis_26379.log
  root      2736    1  0 17:26 ?        00:00:00 redis-sentinel *:26382[sentinel]
  root      2745     1  117:27 ?        00:00:00 redis-sentinel*:26381 [sentinel]
  root      2749  1640  017:27 pts/0    00:00:00 grep redis
  查看集群状态:
  [root@localhost redis]# redis-cli info replication
  # Replication
  role:master
  connected_slaves:2
  slave0:ip=127.0.0.1,port=6381,state=online,offset=262006,lag=0
  slave1:ip=127.0.0.1,port=6382,state=online,offset=262006,lag=0
  master_repl_offset:262139
  repl_backlog_active:1
  repl_backlog_size:1048576
  repl_backlog_first_byte_offset:2
  repl_backlog_histlen:262138
  查看sentinel状态:
  [root@localhost redis]# redis-cli -p 26379 info sentinel
  # Sentinel
  sentinel_masters:1
  sentinel_tilt:0
  sentinel_running_scripts:0
  sentinel_scripts_queue_length:0
  master0:name=mymaster,status=ok,address=127.0.0.1:6379,slaves=2,sentinels=4
  [root@localhost redis]# redis-cli -p 26381 infosentinel
  # Sentinel
  sentinel_masters:1
  sentinel_tilt:0
  sentinel_running_scripts:0
  sentinel_scripts_queue_length:0
  master0:name=mymaster,status=ok,address=127.0.0.1:6379,slaves=2,sentinels=3
  [root@localhost redis]# redis-cli -p 26382 info sentinel
  # Sentinel
  sentinel_masters:1
  sentinel_tilt:0
  sentinel_running_scripts:0
  sentinel_scripts_queue_length:0
  master0:name=mymaster,status=ok,address=127.0.0.1:6379,slaves=2,sentinels=4
  查看sentinel监控的所有master:
  [root@localhost redis]# redis-cli -p 26379 sentinelmasters
  查看mymaster下有哪些slaves
  [root@localhost redis]# redis-cli -p 26379 sentinelslaves mymaster
  强制进行主从切换:
  [root@localhost redis]# redis-cli -p 26379 sentinelfailover mymaster
  OK
  [root@localhost redis]# redis-cli -p 26379 sentinelget-master-addr-by-name mymaster
  1) "127.0.0.1"
  2) "6382"
  [root@localhost redis]# redis-cli -p 26379 sentinelfailover mymaster
  OK
  [root@localhost redis]# redis-cli -p 26379 sentinelget-master-addr-by-name mymaster
  1) "127.0.0.1"
  2) "6381
  查看mymaster集群中的master地址和端口
  [root@localhost redis]# redis-cli -p 26379 sentinelget-master-addr-by-name mymaster
  1) "127.0.0.1"
  2) "6379"
  模拟故障转移:
  Down掉6379服务,看是否自动切换:
  [root@localhost redis]# redis-cli -p 26379 sentinelget-master-addr-by-name mymaster
  1) "127.0.0.1"
  2) "6382"
  从上可看到会自动切换到了6382服务了。
  模拟master恢复服务后的集群状态:
  [root@localhost redis]# redis-cli -p 26379 sentinelget-master-addr-by-name mymaster
  1) "127.0.0.1"
  2) "6382"
  [root@localhost redis]# redis-cli -p 26379 sentinelmasters
  1)  1)"name"
  2)"mymaster"
  3)"ip"
  4)"127.0.0.1"
  5)"port"
  6) "6382"
  。。。。。。。
  [root@localhost redis]# redis-cli -p 26379 sentinelslaves mymaster
  1)  1)"name"
  2)"127.0.0.1:6381"
  3)"ip"
  4)"127.0.0.1"
  5)"port"
  6)"6381"
  7)"runid"
  8)"a05d4350123b04c8bc98b00a3c1b0179b3b756e5"
  9)"flags"
  10) "slave"
  11)"pending-commands"
  12)"0"
  13)"last-ping-sent"
  14)"0"
  15)"last-ok-ping-reply"
  16)"498"
  17)"last-ping-reply"
  18)"498"
  19)"down-after-milliseconds"
  20)"30000"
  21)"info-refresh"
  22)"8512"
  23)"role-reported"
  24)"slave"
  25)"role-reported-time"
  26)"219661"
  27)"master-link-down-time"
  28)"0"
  29)"master-link-status"
  30)"ok"
  31)"master-host"
  32)"127.0.0.1"
  33)"master-port"
  34)"6382"
  35)"slave-priority"
  36)"100"
  37)"slave-repl-offset"
  38)"41424"
  2)  1)"name"
  2)"127.0.0.1:6379"
  3)"ip"
  4)"127.0.0.1"
  5)"port"
  6)"6379"
  7)"runid"
  8)"a2b0b1b19758c3cdfeb534a3c1274bcc6c19e55b"
  9)"flags"
  10)"slave"
  11) "pending-commands"
  12)"0"
  13)"last-ping-sent"
  14)"0"
  15)"last-ok-ping-reply"
  16)"209"
  17)"last-ping-reply"
  18)"209"
  19)"down-after-milliseconds"
  20)"30000"
  21)"info-refresh"
  22)"9908"
  23)"role-reported"
  24)"slave"
  25)"role-reported-time"
  26)"29937"
  27)"master-link-down-time"
  28)"0"
  29)"master-link-status"
  30)"ok"
  31)"master-host"
  32)"127.0.0.1"
  33)"master-port"
  34)"6382"
  35)"slave-priority"
  36)"100"
  37)"slave-repl-offset"
  38)"41158"
  结果:可以从上看出,就算master恢复了,集群也不会让master重新接管,而是作为slave出现了。
  3:设置开机启动(三个节点)
  # echo "redis-sentinel /etc/redis/sentinel_26379.conf " >>/etc/rc.local
  四、注意点:
  1):首次启动时,必须先启动Master
  2):Sentinel 只在 server 端做主从切换,app端要自己开发(例如Jedis库的SentinelJedis,能够监控Sentinel的状态)
  3):若Master已经被判定为下线,Sentinel已经选择了新的Master,也已经将old Master改成Slave,但是还没有将其改成new Master。若此时重启old Master,则Redis集群将处于无Master状态,此时只能手动修改配置文件,然后重新启动集群
  到此redis集群配置完毕


运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-630494-1-1.html 上篇帖子: redis-cluster集群扩容以及扩容client读写数据影响的探究 下篇帖子: Redis3.0集群搭建和测试(cluster)
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表