设为首页 收藏本站
查看: 1027|回复: 0

[经验分享] Heartbeat中Watchdog的使用

[复制链接]

尚未签到

发表于 2015-11-21 11:26:25 | 显示全部楼层 |阅读模式
内核有它自己的方法处理挂起的系统,叫做watchdogwatchdog只是一个内核模块,它检查计时器确定系统是健康的,如果watchdog认为内核挂起,它可能做出激烈的响应,如重启系统,如果你想保护你的高可用服务器配置, 服务器挂起时导致服务中断,Heartbeat也检测不到,你应该在你的内核中启用watchdog注意:这里我们讨论的是服务器挂起而不是应用程序问题,Heartbeat(在编写本书时Heartbeat 2之前的版本还不可用)不会监视它控制的资源或应用程序,看其是否健康-- 要监视必须使用另一个软件包,如Mon,将在第四部分中详细讨论它。
正常情况下,连接到系统的watchdog设备允许内核判断系统是否挂起(当内核看不到外部的计时器设备正确地更新时,它就知道出现某些错误了)。
watchdog代码也支持用软件替换外部的硬件计时器,该软件叫做 softdog,softdog维护一个内部计时器,在另一个进程写入/dev/watchdog设备文件时更新,如果softdog没有看到进程写入/dev/watchdog文件,它认为内核一定出故障了,它将启动一个内核恐慌,正常情况下,内核恐慌将导致系统关闭,但是你可以修改这个默认行为,将 其改为默认行为为重启系统。
当你在/etc/ha.d/ha.cf文件中启用了watchdog选项 后,Heartbeat将每隔相当于deadtime长的时间写入/dev/watchdog文件(或设备),因此,出现任何导致Heartbeat更新 watchdog设备失败的事情,一旦watchdog超时周期(默认是一分钟)过期,watchdog将启动内核恐慌。
配置信息如下:
[iyunv@Server ~]# yum install watchdog*
Loaded plugins: rhnplugin, security
This system is not registered with RHN.
RHN support will be disabled.
Setting up Install Process
Resolving Dependencies
--> Running transaction check
---> Package watchdog.i386 0:5.6-1.el5 set to be updated
--> Finished Dependency Resolution

Dependencies Resolved

====================================================================================================================================
Package                          Arch                         Version                          Repository                    Size
====================================================================================================================================
Installing:
watchdog                         i386                         5.6-1.el5                        base                          66k

Transaction Summary
====================================================================================================================================
Install      1 Package(s)        
Update       0 Package(s)        
Remove       0 Package(s)        

Total download size: 66 k
Is this ok [y/N]: y
Downloading Packages:
watchdog-5.6-1.el5.i386.rpm                                                                                  |  66kB     00:00   
Running rpm_check_debug
Running Transaction Test
Finished Transaction Test
Transaction Test Succeeded
Running Transaction
  Installing     : watchdog                                                                                                     1/1

Installed:
  watchdog.i386 0:5.6-1.el5           

2.开启看门狗选项
[iyunv@Server ~]# vi /etc/ha.d/ha.cf
watchdog /dev/watchdog  取消开头的# 注释
[iyunv@Server ~]# lsmod
Module                  Size  Used by
softdog                 9941  2

3.测试(模拟heartbeat突然崩溃)
[iyunv@Server ~]# ps -ef|grep heartbeat
root      6384     1  0 15:04 ?        00:00:00 heartbeat: master control process
nobody    6387  6384  0 15:04 ?        00:00:00 heartbeat: FIFO reader     
nobody    6388  6384  0 15:04 ?        00:00:00 heartbeat: write: ucast eth0
nobody    6389  6384  0 15:04 ?        00:00:00 heartbeat: read: ucast eth0
nobody    6390  6384  0 15:04 ?        00:00:00 heartbeat: write: ucast eth1
nobody    6391  6384  0 15:04 ?        00:00:00 heartbeat: read: ucast eth1
nobody    6392  6384  0 15:04 ?        00:00:00 heartbeat: write: ping 172.18.4.50
nobody    6393  6384  0 15:04 ?        00:00:00 heartbeat: read: ping 172.18.4.50
root      6420  5515  0 15:06 pts/1    00:00:00 grep heartbeat


[iyunv@Server ~]# Killall -9 heartbeat

[iyunv@Server ~]# ps -ef|grep heartbeat
root      6430  5515  0 15:09 pts/1    00:00:00 grep heartbeat

4.观察日志:
[iyunv@Server ~]# tail -f /var/log/message

Aug  2 15:09:39 Server kernel: SoftDog: Unexpected close, not stopping watchdog!
我们发现 系统已经重启了。。。

参考文章:
http://www.ixdba.net/article/97/2036.html (HeartbeatWatchdog和Softdog的使用)

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-141785-1-1.html 上篇帖子: Heartbeat中Watchdog和Softdog的使用 下篇帖子: heartbeat及相关组件的安装
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表