设为首页 收藏本站
查看: 1469|回复: 0

Nagios实践之路(四)—-主机监控的配置

[复制链接]

尚未签到

发表于 2017-4-20 10:04:37 | 显示全部楼层 |阅读模式
注:本文转载地址:飞阳技术http://blog.chinaunix.net/u/28387/showart_357154.html
     Nagios的主要功能是监控,其监控对象包括主机和服务。在配置需要监控的主机时,不用把主机上面跑的服务和监听的端口等等都加进来,监控主机只是监控该服务器是否是开机,网络是否是正常即可。至于该主机上运行的服务,就交给配置服务的时候再细致的加以配置吧,这样在Nagios的界面中显示的也比较清楚。

      针对主机监控的配置项都是怎样的呢?一般对于主机的监控配置都会写在一个名字为hosts.cfg的配置文件中,以下是定义一台主机可以用到的定义参数:

引用
define host{

host_name host_name    #简短的主机名称

alias alias    #别名,可以更详细的说明主机

address address    #ip地址,当然你如果足够信任你的DNS的话,也可以写名称。如果你不定义这个值,nagios将会用host_name去寻找主机。

parents host_names    #上一节点的名称,也就是指从nagios服务器到被监控主机之间经过的节点,可以是路由、交换机、主机等等。当然,这个节点也要定义,并且要被nagios监控。

hostgroups hostgroup_names    #主机组名称,简短的

check_command command_name    #检查命令的简短名称,如果此项留空,nagios将不会去判断该主机是否alive。

max_check_attempts 整数    #当检查命令的返回值不是“OK”时,重试的次数

check_interval 数字    #循环检查的间隔时间。

active_checks_enabled [0/1]    #是否启用“active_checks”

passive_checks_enabled [0/1]    #是否启用“passive_checks”,及“被动检查”

check_period timeperiod_name    #检测时间段简短名称,注意这个只是个名称,具体的时间段要写在其他的配置文件中哦!

obsess_over_host [0/1]    #是否启用主机操作系统探测。

check_freshness [0/1]    #是否启用freshness测试。freshness测试是对于启用被动测试模式的主机而言的,其作用是定期检查该主机报告的状态信息,如果该状态信息已经过期,freshness将会强制作主机检查。

freshness_threshold  数字     #fressness的临界值,单位为秒。 如果定义为0,则为自动定义。

event_handler command_name    #当主机发生状态改变时,采用的处理命令的简短的名字(可以在commands.cfg中对其定义)

event_handler_enabled [0/1]    #是否启用event_handler

low_flap_threshold  数字    #抖动的下限值。这里我简单解释一下抖动的含义,它定义了这样一种现象:在一段时间内,主机(或服务)的状态值频繁的发生变化,类似一个问题风暴或者一个网络问题。

high_flap_threshold 数字   #抖动的上限值

flap_detection_enabled [0/1]    #是否启用抖动检测

process_perf_data [0/1]    #是否启用processing of performance data

retain_status_information [0/1]    #程序重启时,是否保持主机状态相关的信息

retain_nonstatus_information [0/1]    #程序重启时,是否保持主机状态无关的信息

contact_groups contact_groups    #联系人组(这个组会在contactgroup.cfg文件中定义),在此组中的联系人都会受到该主机的告警提醒信息。

notification_interval  整数    #告警临界值。达到此次数之后,才会发送该机的报警提醒信息。

notification_period timeperiod_name   #该机的告警时间段

notification_options [d,u,r,f]    #该机告警包括的状态变化结果

notifications_enabled [0/1]    #是否启用告警提醒功能

stalking_options [o,d,u]    #持续状态检测参数,o = 持续的UP状态, d = 持续的DOWN状态, and u = 持续的UNREACHABLE状态.

}


       呵呵,看了上面那么长的配置说明是否有点头晕,一般我们对主机的监控需求是很简单的,如:

         在任何时间内,只要用ping命令判断是否可以ping通主机即可。连续出现5次ping不通,则断定其出现问题。连续出现3次问题发通知到mygroup 组。发送提醒包括以下状态改变:DOWN(ping不通) UNREACHABLE(不可达) RECOVERY(恢复正常,可以ping通了)

       根据以上需求,其监控主机的配置如下即可:

引用
define host {

host_name test.1

alias test.1

address 192.168.0.1

contact_groups mygroup

check_command check-host-alive

max_check_attempts 5

notification_interval  3

notification_period 24x7

notification_options d,u,r

}

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-366712-1-1.html 上篇帖子: nagios使用经常碰到的几种问题及处理办法 下篇帖子: 将应用上的消息发送至Nagios的方法(java)
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表