设为首页 收藏本站
查看: 3511|回复: 0

[经验分享] zabbix使用过程中遇到的问题与解决方法

[复制链接]
累计签到:1 天
连续签到:1 天
发表于 2015-12-16 09:27:26 | 显示全部楼层 |阅读模式
一、不同的zabbix版本,不能支持完整的模版导入导出。

    旧的zabbix是2.2.0版本,新的zabbix是2.2.9,想把原来的监控模版导过来,结果失败了。
    总结了几点不同之处:
1、操作符不兼容:
旧版:与:and;或 or;不等于 <> ;
新版:与:& ;或 | ;不等于 # ;

2、不兼容最频繁的地方在trigger。可以将旧模版导出来后,把.xml文本里的trigger部分删掉,尝试导入。一般情况下,Item部分可以导入。

二、磁盘监控报警范围不对
    原来的zabbix监控平台中,对于disk的监控,需求是,home、root等目录磁盘空间不足时,报警。但是实际情况是,很多子目录均告警,比如/sys、/home/rpm/等磁盘空间小于5%。正常情况下,这些磁盘不列在监控范围。
原因:
没有增加相应的filter。(对比时发现了这个filter,但旧版的filter是单独一个分页,新版里没有找到分页,所以当时就没增加。)
解决方法:
    增加filter。将所有报错的host全部delete并重新增加host后,监控正常。

QQ截图20151216091608.png

三、创建新模版界面err信息
    创建新的模版时,创建界面有如下报错,但并不影响模版的创建:
array_combine():Both parameters should have at least 1 element [templates.php:464 →CView->render() → include() →array_combine() in/var/www/zabbix/include/views/configuration.template.edit.php:173]

原因:
提示模版中至少应该增加host或group一项信息。
解决方法:
    将新建的模版增加到TEMPLATES组后,不显示该报错了。

一、旧版本中很多trigger不能用,比如下面的一个trigger expression是这样的::system.cpu.load[percpu,avg5].avg(5m)}>{$CPU_LOAD_NUM_W_GT_N},其中,CPU_LOAD_NUM_W_GT_N不是具体的数值
原因:
这些是宏定义的macros值,模版虽然迁移过来了但是这些宏定义的macros值并未进行设置。
解决方法:
       Administration → General → Macros,添加各个macros值。

二、新增的host不能自动链接模版和添加group信息
原因:
没有相应的自动发现规则
解决方法:
    根据需求创建自动发现的action,可以根据host的name规范,检查其中的关键字,比如:hostname中带有mysql字样的host自动添加到mysql模版

三、proxy上挂了100+台 host时,proxy挂了
原因:
Proxy挂了,查看日志,发现是内存溢出
[iyunv@Proxyzabbix]# tail -10 zabbix_proxy.log
18569:20151201:164406.815 __mem_malloc: skipped 0 asked 104 skip_min4294967295 skip_max 0
18569:20151201:164406.815 [file:dbconfig.c,line:410]zbx_mem_malloc(): out of memory (requested 103 bytes)
18569:20151201:164406.815 [file:dbconfig.c,line:410]zbx_mem_malloc(): please increase CacheSize configuration parameter
18558:20151201:164406.957 One child process died (PID:18569,exitcode/signal:255).Exiting ...
18558:20151201:164408.960syncing history data...
18558:20151201:164409.088syncing history data done
18558:20151201:164409.088Zabbix Proxy stopped. Zabbix 2.2.2 (revision 42525).
解决方法:
vimzabbix_proxy.conf,修改cachesize的值。原来使用了默认值8M,现在修改为1024M
###Option: CacheSize
#       Size of configuration cache, in bytes.
#       Shared memory size, for storing hostsand items data.
#
#Mandatory: no
#Range: 128K-2G
#Default:
#CacheSize=8M
CacheSize=1024M

一、zabbix-proxy监控报错:Zabbix unreachable poller processes more than75% busy。
原因:
    Zabbix-proxy服务器负载增加,导致内存、IO等分配不足
解决方法:
调整参数StartPollers=260(原来是160),重启proxy

问题2:
调整完参数后,proxy又挂了。查看日志:

[iyunv@DB_Proxyzabbix]# tail -10 /var/log/zabbix/zabbix_proxy.log
49952:20151202:134331.419 [Z3001] connection todatabase 'zabbix' failed: [1040] Too many connections
49949:20151202:134331.419 [Z3001] connectionto database 'zabbix' failed: [1040] Too many connections
49952:20151202:134331.419 Cannot connect tothe database. Exiting...
49949:20151202:134331.419 Cannot connect tothe database. Exiting...
49968:20151202:134331.419 [Z3001] connectionto database 'zabbix' failed: [1040] Too many connections
49968:20151202:134331.419 Cannot connect tothe database. Exiting...
49401:20151202:134331.420 One child processdied (PID:49952,exitcode/signal:255). Exiting ...
49401:20151202:134333.423 syncing historydata...
49401:20151202:134333.468 syncing history datadone
49401:20151202:134333.468 Zabbix Proxystopped. Zabbix 2.2.2 (revision 42525).
原因:
     Mysql数据库连接数不足
解决方法:
    调整my.cnf中max_connection=1000(原来是350),重启mysql服务,重启proxy


二、邮件一直报Zabbix agent on {HOST.NAME} is unreachable for 5 minutes。Host不固定。

zabbix_Proxy端主机挂了约300台,Zabbix proxy出现了严重的性能问题,有些数据获取不到,或者图形会缺数据。

尝试了更新proxy服务器配置,原来的proxy机器是R410,内存16G,换成R710,内存32G。还是一直报这个错误。

最后百度的解决方案是:

1、修改每一个 item 的监控模式,Item勾选后,下面选择Mass Update,go进入页面将type修改为zabbix agent(active)模式。


      2、Proxy配置调整

      StartPollers=450;

      StartTrappers=200;


   3、原来mysql的my.cnf中的innodb buffer pool size配置过多,12G,改为4G


三、部分数据比如: 磁盘I/O利用率,proxy服务器get可以获取到,但web页面no data,不出图。
    zabbix监控页面,显示nodata,在proxy linux服务器使用 zabbix get key值可以获得,比较慢,需要3-4秒时间,但是能获得结果

原因:
还是内存的问题。
解决方法:
调整proxy参数配置:原来下面两个参数配置都是1024M
HistoryCacheSize=1536M
           CacheSize=1536M




运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-151836-1-1.html 上篇帖子: Zabbix-proxy搭建 下篇帖子: zabbix对网络要求和平台要求
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表