设为首页 收藏本站
查看: 756|回复: 0

[经验分享] zabbix value map导致报警失效问题一例

[复制链接]

尚未签到

发表于 2019-1-19 10:07:57 | 显示全部楼层 |阅读模式
今天一台线上的datanode挂了,但是没有zabbix agent unreachable的报警,不过幸好有host update percent的报警。看了下item和trigger的设置,item是zabbix内置的agent.ping,trigger设置是nodata(5m)=1,即5分钟获取不到agent.ping的值就会报警。。
  由于zabbix server log翻转的比较快,同时日志大小设置的为1g,所以出问题时候的日志没办法看了。。只能从数据库开始入手了。查看triggers表,可以看到value确实是1,functions表中的functin+parameter也是nodata+1m,证明是可以正确触发报警的。
select triggerid,expression,description,value,from_unixtime(lastchange ,'%Y%m%d %H:%i:%S') from triggers where triggerid='6347';
+-----------+------------+----------------------------------------------------------+-------+----------------------------------------------+
| triggerid | expression | description                                              | value | from_unixtime(lastchange ,'%Y%m%d %H:%i:%S') |
+-----------+------------+----------------------------------------------------------+-------+----------------------------------------------+
|      6347 | {10832}=1  | Zabbix agent on {HOST.NAME} is unreachable for1  minutes |     1 | 20140312 11:47:31                            |
+-----------+------------+----------------------------------------------------------+-------+----------------------------------------------+
select * from functions where  itemid='27731';                 
+------------+--------+-----------+----------+-----------+
| functionid | itemid | triggerid | function | parameter |
+------------+--------+-----------+----------+-----------+
|      10832 |  27731 |      6347 | nodata   | 1m        |
+------------+--------+-----------+----------+-----------+


查看alerts表中相关时间段的记录,可以看到确实有相关的记录,由于是用了zabbix 执行command的方式来实现报警,可以看到在message字段中存储的是当时报警是执行脚本的信息:


select alertid,actionid,eventid,from_unixtime(clock,'%Y%m%d %H:%i:%S'),message from alerts where message like 'hostname%';
|  468566 |        5 | 3256580 | 20140312 09:04:02 | hostname:/apps/svr/zabbix_server/scripts/zabbix_exec_command.py ip  23500 "Agent ping"  hostname  agent.ping  Up (1)  PROBLEM                                            |
|  468567 |        5 | 3256580 | 20140312 09:06:03 | hostname:/apps/svr/zabbix_server/scripts/zabbix_exec_command.py ip  23500 "Agent ping"  hostname  agent.ping  Up (1)  PROBLEM手动执行脚本,报错:
/apps/svr/zabbix_server/scripts/zabbix_exec_command.py ip  27731 "Agent ping"  hostname agent.ping  Up (1)  PROBLEM
-bash: syntax error near unexpected token `('脚本输入参数的顺序:ip,itemid,itemname,hostname,itemkey,itemvalue,triggerstatus,出问题的时itemvalue字段,因为没有用引号,导致脚本运行出错,fix下脚本就可以了。。。
不过,rc还没有找到,这个Up (1) 是怎么来的呢?一般情况下数字型的item产生的itemvalue不会有这种值啊?
为了验证这个问题,手动stop掉一台机器zabbix_agentd进程,并查看zabbix server端的log:
发现在存储agent.ping类的item的值时,有如下操作,把1变成了UP(1)。
5009:20140312:113302.211 In zbx_format_value()
5009:20140312:113302.211 In replace_value_by_map() value:'1' valuemapid:10
5009:20140312:113302.211 query [txnlev:1] [select newvalue from mappings where valuemapid=10 and value='1']
5009:20140312:113302.211 End of replace_value_by_map() value:'Up (1)'说明还是和item的设置有关,再来看agent.ping的设置,在show value设置中,可以看到并不是as is,而是设置的zabbix agent ping status,这里面就是1->up的map:




再来看zabbix的doc中关于map value的描述,其实是为了返回更易理解的值:
For a more “human” representation of received values, you can use value maps that contain the mapping between numeric values and string representations.
rc找到了,把show value改成as is就ok了。
小结:
1.日志+数据库是解决zabbix问题的利器。
2.有时候需要设置多种报警方式,比如在这个例子中,由于有zabbix host update percent的报警,发现了这个问题。








运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-665074-1-1.html 上篇帖子: zabbix agent 监控 HP Smart Array 状态信息实现 下篇帖子: Zabbix 添加QQ消息的方式进行告警
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表