设为首页 收藏本站
查看: 1169|回复: 0

[经验分享] zabbix value type导致的断图一例

[复制链接]

尚未签到

发表于 2019-1-18 10:37:28 | 显示全部楼层 |阅读模式
  最近老毕在加hbase的监控,发现生成的graph有断图的情况。。因为之前有次zabbix断图定位到了是proxy的性能问题,通过调整相应的参数解决掉了。。再看这次的情况,发现有些item的graph是ok的,也就排除了proxy性能问题。。看来还是和item相关。

  整个数据链路是agent---proxy(db)----server(db),从上游数据库开始入手:
  1.找出正常的和断图的item做对比
select i.itemid,h.host from items i,hosts h where i.hostid=h.hostid and h.host='xxxx' and i.name in ('regionserver writeRequestsCount','regionserver requests');
+--------+----------------------------------------------+
| itemid | host                                         |
+--------+----------------------------------------------+
|  53855 | xxxx |
|  53895 | xxxx |
+--------+----------------------------------------------+  2.首先看server端和proxy端item的interval同步的情况(都是60s),没有异常。。
  3.在server端的数据库中查看item的lastvalue的同步时间,发现出问题的item lastclock存在些问题,有问题的item有时候会很长时间都不会更新。
select current_timestamp();
+---------------------+
| current_timestamp() |
+---------------------+
| 2014-03-14 11:22:23 |
+---------------------+
select itemid,key_,delay,lastvalue,from_unixtime(lastclock,'%Y%m%d %H:%i:%S') from items where itemid in ('53855','53895');
+--------+-----------------------------------------------+-------+-----------+--------------------------------------------+
| itemid | key_                                          | delay | lastvalue | from_unixtime(lastclock,'%Y%m%d %H:%i:%S') |
+--------+-----------------------------------------------+-------+-----------+--------------------------------------------+
|  53855 | hadoop_stats[regionserver,requests]           |    60 | 0         | 20140314 11:15:19                          |
|  53895 | hadoop_stats[regionserver,writeRequestsCount] |    60 | 291       | 20140314 11:21:52                          |
+--------+-----------------------------------------------+-------+-----------+--------------------------------------------+  4.在server的history相应的表查看断图的item一段时间值的分布情况,发现不是一分钟一条数据。

select from_unixtime(clock,'%Y%m%d %H:%i:%S'),value from history_uint where itemid in ('53855');
| 20140314 11:12:02                      |     0 |
| 20140314 11:26:10                      |     0 |
| 20140314 11:27:11                      |     0 |
| 20140314 11:28:12                      |     0 |
| 20140314 11:29:13                      |    10 |
| 20140314 11:30:28                      |     0 |
| 20140314 11:31:29                      |     0 |
| 20140314 11:32:29                      |     0 |
| 20140314 11:33:30                      |     0 |
| 20140314 11:34:46                      |     0 |  5.proxy相对应的history_proxy表中查看相关数据,发现在value字段有Received value xxx isnotsuitable forvalue type的信息,看来和数据的类型有关系。
select id,from_unixtime(clock,'%Y%m%d %H:%i:%S'),value from proxy_history where itemid in ('53855');   
+------------+----------------------------------------+--------------------------------------------------------------------------------------------------------+
| id         | from_unixtime(clock,'%Y%m%d %H:%i:%S') | value                                                                                                  |
+------------+----------------------------------------+--------------------------------------------------------------------------------------------------------+
| 4792921942 | 20140314 11:12:02                      | 0                                                                                                      |
| 4792948233 | 20140314 11:13:19                      | Received value [283.33334] is not suitable for value type [Numeric (unsigned)] and data type [Decimal] |
| 4792967862 | 20140314 11:14:19                      | Received value [266.33334] is not suitable for value type [Numeric (unsigned)] and data type [Decimal] |
| 4792987031 | 20140314 11:15:19                      | Received value [315.33334] is not suitable for value type [Numeric (unsigned)] and data type [Decimal] |
| 4793199599 | 20140314 11:26:10                      | 0                                                                                                      |
| 4793219166 | 20140314 11:27:11                      | 0                                                                                                      |
| 4793239212 | 20140314 11:28:12                      | 0                                                                                                      |
| 4793258721 | 20140314 11:29:13                      | 10                                                                                                     |
| 4793283508 | 20140314 11:30:28                      | 0                                                                                                      |
| 4793303560 | 20140314 11:31:29                      | 0                                                                                                      |
| 4793322826 | 20140314 11:32:29                      | 0                                                                                                      |
| 4793342173 | 20140314 11:33:30                      | 0                                                                                                      |
+------------+----------------------------------------+--------------------------------------------------------------------------------------------------------+  6.查看item的设置,发现value type设置的是Numeric(unsigned)的,而item的值会产生float类型的值,proxy_history的value字段是longtext类型的,而server端history_uint表的字段是bigint类型的。在类型转换存储的时候就会造成数据的丢失。其实在item表中有个error的信息字段,是记录了item获取值存在的错误的。。可以通过这个直接定位到问题。
  问题rc找到了,为了方便可以直接通过update 数据库来fix这个问题。
update items set value_type=0 where value_type=3 and (key_ like 'hadoop_stats[regionserver%' or key_ like 'hadoop_stats[hmaster%');  不过发现一个比较奇怪的问题,在value type不正确的时候,agent数据获取并不是根据interval来的,有时候会间隔10min左右。。这样也加剧了history表中数据丢失的严重性,不知道是不知zabbix agent内部的机制,有时间需要看看代码才行。

  agent端对应日志:
7964:20140314:111202.800 For key [hadoop_stats[regionserver,requests]] received value [0.0]
7964:20140314:111319.053 For key [hadoop_stats[regionserver,requests]] received value [283.33334]
7964:20140314:111419.454 For key [hadoop_stats[regionserver,requests]] received value [266.33334]
7964:20140314:111519.532 For key [hadoop_stats[regionserver,requests]] received value [315.33334]
#中间10分钟左右没有值产生
7964:20140314:112610.705 For key [hadoop_stats[regionserver,requests]] received value [0.0]
7964:20140314:112711.308 For key [hadoop_stats[regionserver,requests]] received value [0.0]
7964:20140314:112812.375 For key [hadoop_stats[regionserver,requests]] received value [0.0]
7964:20140314:112913.086 For key [hadoop_stats[regionserver,requests]] received value [10.0]
7964:20140314:113028.703 For key [hadoop_stats[regionserver,requests]] received value [0.0]
7964:20140314:113129.180 For key [hadoop_stats[regionserver,requests]] received value [0.0]
7964:20140314:113229.941 For key [hadoop_stats[regionserver,requests]] received value [0.0]
7964:20140314:113330.568 For key [hadoop_stats[regionserver,requests]] received value [0.0]
7964:20140314:113446.343 For key [hadoop_stats[regionserver,requests]] received value [0.0]
7964:20140314:113546.977 For key [hadoop_stats[regionserver,requests]] received value [0.0]  最后贴下更新后的graph情况:

  再附一个value type和history的对应关系:

  





运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-664719-1-1.html 上篇帖子: Grafana安装记录(zabbix3.2+Grafana4.1.1) 下篇帖子: zabbix监控esxi主机
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表