zabbix学习(九)触发器相关

jxwjq · 发表于 2019-1-19 10:00:30

　　触发器参数及配置
　　1.创建触发器

　　点击Configuration（配置） → Hosts（主机）
　　点击hosts（主机）相关行的trigger
　　点击右上角的创建触发器（create trigger），你也可以修改列表中的触发器

　　在表单中输入相应的信息
2. 配置触发器

　　参数介绍
参数描述Name触发器名称.　　名称可以包含宏变量： {HOST.HOST}, {HOST.NAME}, {HOST.CONN}, {HOST.DNS}, {HOST.IP}, {ITEM.VALUE}, {ITEM.LASTVALUE} and {$MACRO}.
　　$1, $2…$9 可以被用来关联表达式的常量
　　示例：
　　name：Processor load above $1 on {HOST.NAME}”
　　表达式：system.cpu.load[percpu,avg1].last(0)}>5
　　会显示为：Processor load above 5 on ttlsa云服务器
Expression计算触发器状态的逻辑表达式，这边设置为上一次值等于0Multiple PROBLEM events generation通过设置该选项，你可以在触发器产生problem的时候触发一个事件Description触发器的描述,一般name写的不清楚，这边可以具体描述这个触发器的作用，例如nginx当前离线，请处理等等。Zabbix 2.2版本开始，支持触发器名称。URL在Monitoring → Triggers中，可以看到URL并且可以点击，一般情况下他需要配合触发器ID来使用，在url中包含触发器ID（宏变量 {TRIGGER.ID}），这样可以直接点击到具体触发器中。Severity设置严重性级别,上图我设置为“灾难”,你可以相应的设置警告、严重等状态的触发器Enabled当前触发器是否启用　　触发器依赖关系详解
概述
　　zabbix触发器可以设置依赖性，例如我配置了两个触发器，一个触发器定义www.ttlsa.com这个HOST是否在运行中，另一个是www.ttlsa.com的网络是否通畅。假如网络出现故障，但是ttlsa服务器并未出现故障，我们依旧会收到这两个触发器给到的故障通知。
　　现在的问题很明显，HOST是正常的，肯定不希望收到他的故障信息，因为它正常工作。所以在配置HOST触发器时，我们需要增加依赖关系，依赖网络是否畅通这个触发器。一旦网络出现故障，将不会出发HOST故障的通知。单个触发器可以依赖于多个触发器。
触发器依赖要点
　　一台HOST的触发器可以依赖其他HOST的触发器，但是注意不要有死循环依赖。比如A依赖B，B依赖C，C又依赖A。一个圆圈，没完没了。如下是A依赖B，B又依赖A，根本依赖不了，有如下报错

　　一个模板的触发器可以依赖另外一个模板的触发器，例如模板A触发器依赖模板B触发器。一个HOST要链接A模板，那么它同时要链接A模板（因为模
板A中的触发器依赖了模板B中的触发器），但是HOST可以单独链接模板B（B是被依赖）。在一个host单独链接template
A，结果出现如下错误，所以别忘记了一起把template B也链接到HOST中

　　模板中的触发器可以依赖HOST中的触发器。如果某个HOST链接这类模板，那么HOST创建的相应的触发器也同样会依赖那个HOST的触发器。
举个官方的例子，某个模板中的一些触发器依赖了route/主机的触发器，凡事链接（理解为套用）了这个模板的机器都会依赖这些router/主机。说了
那么多，其实就是继承了。
　　HOST中的触发器不能依赖模板中的触发器。
配置

　　编辑触发器，选择选项卡“dependencies”，点击Add，选择你需要依赖的触发器，如下图：

　　然后点击保存，可以看到触发器多了一个depend on
多个依赖实例
　　借用官方文档的示例，Host前面有个Router2，Router2前面有Router1，如下：
Zabbix - Router1 - Router2 - Host　　如果Router1挂了，很明显Router2和Host连不上，我们不希望收到关于连不上Router2和HOST的通知，因此，我们定义了如下依赖关系：
'Host is down' trigger depends on 'Router2 is down'　　
trigger'Router2 is down' trigger depends on 'Router1 is down' trigger
　　在触发器将Host的状态改变为’Host is down’之前，它会检查host相关的依赖，这时候如果发现它依赖的触发器只要出现一个problem状态，那么当前触发器状态不会变化，这样一来action不会执行，报警通知sms/email自然也不会发送了。
　　zabbix会递归执行检测，如果router1或者router2有一个出现连不上，那么Host的触发器不会有任何的改变。
　　
　　触发器表达式详解
概述
　　触发器中的表达式使用很灵活，我们可以创建一个复杂的逻辑测试监控，触发器表达式形式如下:
{:.()}Functions函数
　　触发器functions可以引用检索到的值，当前时间或者其他元素。触发器表达式支持的function完整列表请点击官网地址 supported functions
　　大多数数值functions可以使用秒来作为参数。你可以使用前缀“#”来表示它有不同的含义
FUNCTION CALL描述sum(600)600秒内的总和sum(#5)最新5个值的和　　last函数使用不同的参数将会得到不同的值，#2表示倒数第二新的数据。例入从老到最新值为1,2,3,4,5,6,7,8,9,10，last(#2)得到的值为9，last(#9)得到的值为2。last函数必须包含参数。
　　AVG，count，last，min和max函数还支持额外的参数，以秒为单位的参数time_shift（时间偏移量）。例如avg(1h,1d)，那么将会获取到昨天的1小时内的平均数据。
　　[warning]备注：触发器表达式需要使用history历史数据来计算，如果history不可用（time_shift时间偏移量参数无法使用），因此history记录一定要保留长久一点，至少要保留需要用的记录。[/warning]
　　触发器表达式可以使用单位符号来替代大数字，例如5m替代300，或者1d替代86400,1k替代1024字节等等。
操作符
优先级操作定义1/除2*乘3-减4+加5=B+0.000001)
7#不等于.用法如下:　　A#B (A=B+0.000001)
8=等于. T用法如下:　　A=B (A>B-0.000001) & (A5　　触发器说明：
　　www.zabbix.com：host名称
　　system.cpu.load[all,avg1]：item值,一分内cpu平均负载值
　　last(0)：最新值
　　>5：最新值大于5
　　如上所示，www.zabbix.com这个主机的监控项，最新的CPU负载值如果大于5，那么表达式会返回true，这样一来触发器状态就改变为“problem”了
Example 2
　　www.zabbix.com is overloaded
{www.zabbix.com:system.cpu.load[all,avg1].last()}>5|{www.zabbix.com:system.cpu.load[all,avg1].min(10m)}>2　　当前cpu负载大于5或者最近10分内的cpu负载大于2，那么表达式将会返回true
Example 3
　　/etc/passwd has been changed
　　Use of function diff:
{www.zabbix.com:vfs.file.cksum[/etc/passwd].diff()}>0　　/etc/passwd最新的checksum与上一次获取到的checksum不同，表达式将会返回true.
我们可以使用同样的方法监控系统重要的配置文件,例如/etc/passwd,/etc/inetd.conf等等。这些zabbix一般都会自带，没带
的你自己加上吧。
Example 4
　　Someone is downloading a large file from the Internet
　　Use of function min:
{www.zabbix.com:net.if.in[eth0,bytes].min(5m)}>100K　　The expression is true when number of received bytes on eth0 is more than 100 KB within last 5 minutes.
Example 5
　　Both nodes of clustered SMTP server are down
　　Note use of two different hosts in one expression:
{smtp1.zabbix.com:net.tcp.service[smtp].last()}=0&{smtp2.zabbix.com:net.tcp.service[smtp].last()}=0　　当smtp1.zabbix.com和smtp2.zabbix.com两台主机上的SMTP服务器都离线，表达式将会返回true.
Example 6
　　Zabbix agent needs to be upgraded
　　Use of function str():
{zabbix.zabbix.com:agent.version.str("beta8")}=1　　当smtp1.zabbix.com和smtp2.zabbix.com两台主机上的SMTP服务器都离线，表达式将会返回true.
Example 7
　　Server is unreachable
{zabbix.zabbix.com:icmpping.count(30m,0)}>5　　如上表达式表示最近30分钟zabbix.zabbix.com这个主机超过5次不可到达
Example 8
　　No heartbeats within last 3 minutes
　　Use of function nodata():
{zabbix.zabbix.com:tick.nodata(3m)}=1　　tick为Zabbix trapper类型，首先我们要定义一个类型为Zabbix
trapper，key为tick的item。我们使用zabbix_sender定期发送数据给tick，如果在3分钟内还未收到
zabbix_sender发送来的数据，那么表达式返回一个true，与此同时触发器的值变为“PROBLEM”。
Example 9
　　CPU activity at night time
　　Use of function time():
{zabbix:system.cpu.load[all,avg1].min(5m)}>2&{zabbix:system.cpu.load[all,avg1].time()}>000000&{zabbix:system.cpu.load[all,avg1].time()}2　　This expression will fire if the average load of the last hour tops the
average load of the same hour yesterday more than two times.
Hysteresis（迟滞,滞后）
　　简单的说触发器状态转变为problem需要一个条件，从problem转变回来还需要一个条件才行。一般触发器只需要不满足触发器为problem条件即可恢复。明白了么？不明白就看例子吧。
　　有时候触发器需要使用不同的条件来表示不同的状态，举个官网很有趣的例子：机房温度正常稳定为15-20°，当温度超过20°，触发器值为problem，当问题到了15°与20°之间，异常会解除。别整这些没用的，我们看实例.
　　为了达到这个效果，我们需要使用如下触发器表达式:
Example 1
　　Temperature in server room is too high
({TRIGGER.VALUE}=0&{server:temp.last()}>20)|　　
({TRIGGER.VALUE}=1&{server:temp.last()}>15)
　　如上有两个小括号，前面一个表示触发异常的条件，后面一个表达式表示解除异常的条件。
　　注意：宏变量 {TRIGGER.VALUE}将会返回当前触发器的值
Example 2
　　Free disk space is too low
Problem: 最近5分钟剩余磁盘空间小于10GB。（异常）　　
Recovery: 最近10分钟磁盘空间大于40GB。（恢复）
({TRIGGER.VALUE}=0&{server:vfs.fs.size[/,free].max(5m)}

账号		自动登录	找回密码
密码			立即注册

大疆运维招人啦，

C++ :try 语句块和异常处理

C++的多态

Red Hat RHCE 8 (EX294) Cert Guide

Java/C++ 区别：看完这一篇，就够用！

别再用过时库了！这 13 个顶级 C++ 库才是

c++ size_t 和 int 的区别

[经验分享] zabbix学习(九)触发器相关

浏览过的版块

扫码加入运维网微信交流群