liuming794 发表于 2019-1-18 07:12:33

zabbix告警配置

  告警概述

告警是监控的重要职能,是指将达到某一阈值时间的消息发给用户,让用户在事件发生的
时候即可知道监控项处于不正常状态,从而让用户来觉得是否采取相关措施。
在zabbix中,告警是由一系列的流程组成的,首先是触发器达到阈值,接下来是Action对
事件信息进行处理,其中包括两部分:第一部分是发送消息,即将告警信息发给用户;第
二部分是执行命令,即将事件用命令进行处理,达到时间故障自动尝试回复的效果。
zabbix的告警流程如下:
Host group(设备组) →Hosts(设备)→ Applications(监控项组)→ Items(监控项)→ Triggers
(触发器)→Actions(告警动作)→ Medias(告警方式)→ User Groups→ Users
  Zabbix告警的配置步骤如下:


[*]设置Trigger
[*]配置用户
[*]配置告警介质
[*]设置Action
  Trigger的配置

我们知道Items的作用是采集数据,而不是判断采集到的数据是否属于正常值;Trigger的作
用是对采集到的数据进行阈值状态的判断,出发阈值,则会产生一个事件,同时,Action对
达到条件的Trigger触发告警动作。
1.Tigger的状态如表




描述




OK
正常状态(老版本中是FALSE)


PROBLEM
有事件发生,例如,CPU负载过高(老版本中是TRUE)



2.Trigger的配置步骤
Trigger的配置是通过单击菜单栏中的Configuration →Template/Hosts→Trigger → Create→trigger
这里以配置一个用户登录的触发器为例:
  单击如图所示的Create trigger
http://i2.运维网.com/images/blog/201803/12/82d986dcf6af900cfbf24e425e3178dc.png
  单击如图“Add”按钮添加正规逻辑表达式
http://i2.运维网.com/images/blog/201803/12/edfe6a3482652f368d700654a527b6bd.png
  在Item下拉列表中选择Number of logged in users
http://i2.运维网.com/images/blog/201803/12/d83f15dee5eeb803d9645d0884365cc9.png
  其中的Function是触发器的函数表达式
http://i2.运维网.com/images/blog/201803/12/b6cbe772e45bf94969ea364c0e9a42ed.png
  选择Last函数。Last of为时间,Time shift为时间偏移,N为触发器的条件判断
http://i2.运维网.com/images/blog/201803/12/f70d6fbc13a91a9bc04361517845082a.png
  配置后的选项如图
http://i2.运维网.com/images/blog/201803/12/d9d4f73247383a915eebe0f51e200b31.png
http://i2.运维网.com/images/blog/201803/12/d4d8dc76df5531ec6b0f8be336a33047.png
http://i2.运维网.com/images/blog/201803/12/a5eea8ad034728c7317f2852b7d0bd5a.png



页: [1]
查看完整版本: zabbix告警配置