3rwdq 发表于 2015-12-16 09:27:26

zabbix使用过程中遇到的问题与解决方法

一、不同的zabbix版本,不能支持完整的模版导入导出。

    旧的zabbix是2.2.0版本,新的zabbix是2.2.9,想把原来的监控模版导过来,结果失败了。
    总结了几点不同之处:
1、操作符不兼容:旧版:与:and;或 or;不等于 <> ;新版:与:& ;或 | ;不等于 # ;

2、不兼容最频繁的地方在trigger。可以将旧模版导出来后,把.xml文本里的trigger部分删掉,尝试导入。一般情况下,Item部分可以导入。

二、磁盘监控报警范围不对
    原来的zabbix监控平台中,对于disk的监控,需求是,home、root等目录磁盘空间不足时,报警。但是实际情况是,很多子目录均告警,比如/sys、/home/rpm/等磁盘空间小于5%。正常情况下,这些磁盘不列在监控范围。原因:没有增加相应的filter。(对比时发现了这个filter,但旧版的filter是单独一个分页,新版里没有找到分页,所以当时就没增加。)解决方法:    增加filter。将所有报错的host全部delete并重新增加host后,监控正常。


三、创建新模版界面err信息    创建新的模版时,创建界面有如下报错,但并不影响模版的创建:array_combine():Both parameters should have at least 1 element

原因:提示模版中至少应该增加host或group一项信息。解决方法:    将新建的模版增加到TEMPLATES组后,不显示该报错了。

一、旧版本中很多trigger不能用,比如下面的一个trigger expression是这样的::system.cpu.load.avg(5m)}>{$CPU_LOAD_NUM_W_GT_N},其中,CPU_LOAD_NUM_W_GT_N不是具体的数值
原因:这些是宏定义的macros值,模版虽然迁移过来了但是这些宏定义的macros值并未进行设置。解决方法:       Administration → General → Macros,添加各个macros值。

二、新增的host不能自动链接模版和添加group信息
原因:没有相应的自动发现规则解决方法:    根据需求创建自动发现的action,可以根据host的name规范,检查其中的关键字,比如:hostname中带有mysql字样的host自动添加到mysql模版

三、proxy上挂了100+台 host时,proxy挂了
原因:Proxy挂了,查看日志,发现是内存溢出# tail -10 zabbix_proxy.log18569:20151201:164406.815 __mem_malloc: skipped 0 asked 104 skip_min4294967295 skip_max 0
18569:20151201:164406.815 zbx_mem_malloc(): out of memory (requested 103 bytes)18569:20151201:164406.815 zbx_mem_malloc(): please increase CacheSize configuration parameter18558:20151201:164406.957 One child process died (PID:18569,exitcode/signal:255).Exiting ...18558:20151201:164408.960syncing history data...18558:20151201:164409.088syncing history data done18558:20151201:164409.088Zabbix Proxy stopped. Zabbix 2.2.2 (revision 42525).解决方法:vimzabbix_proxy.conf,修改cachesize的值。原来使用了默认值8M,现在修改为1024M###Option: CacheSize#       Size of configuration cache, in bytes.#       Shared memory size, for storing hostsand items data.##Mandatory: no#Range: 128K-2G#Default:#CacheSize=8MCacheSize=1024M

一、zabbix-proxy监控报错:Zabbix unreachable poller processes more than75% busy。
原因:    Zabbix-proxy服务器负载增加,导致内存、IO等分配不足解决方法:调整参数StartPollers=260(原来是160),重启proxy

问题2:调整完参数后,proxy又挂了。查看日志:
# tail -10 /var/log/zabbix/zabbix_proxy.log 49952:20151202:134331.419 connection todatabase 'zabbix' failed: Too many connections 49949:20151202:134331.419 connectionto database 'zabbix' failed: Too many connections 49952:20151202:134331.419 Cannot connect tothe database. Exiting... 49949:20151202:134331.419 Cannot connect tothe database. Exiting... 49968:20151202:134331.419 connectionto database 'zabbix' failed: Too many connections 49968:20151202:134331.419 Cannot connect tothe database. Exiting... 49401:20151202:134331.420 One child processdied (PID:49952,exitcode/signal:255). Exiting ... 49401:20151202:134333.423 syncing historydata... 49401:20151202:134333.468 syncing history datadone 49401:20151202:134333.468 Zabbix Proxystopped. Zabbix 2.2.2 (revision 42525).原因:   Mysql数据库连接数不足解决方法:    调整my.cnf中max_connection=1000(原来是350),重启mysql服务,重启proxy


二、邮件一直报Zabbix agent on {HOST.NAME} is unreachable for 5 minutes。Host不固定。

zabbix_Proxy端主机挂了约300台,Zabbix proxy出现了严重的性能问题,有些数据获取不到,或者图形会缺数据。尝试了更新proxy服务器配置,原来的proxy机器是R410,内存16G,换成R710,内存32G。还是一直报这个错误。最后百度的解决方案是:1、修改每一个 item 的监控模式,Item勾选后,下面选择Mass Update,go进入页面将type修改为zabbix agent(active)模式。
      2、Proxy配置调整      StartPollers=450;      StartTrappers=200;
   3、原来mysql的my.cnf中的innodb buffer pool size配置过多,12G,改为4G


三、部分数据比如: 磁盘I/O利用率,proxy服务器get可以获取到,但web页面no data,不出图。
    zabbix监控页面,显示nodata,在proxy linux服务器使用 zabbix get key值可以获得,比较慢,需要3-4秒时间,但是能获得结果

原因:还是内存的问题。解决方法:调整proxy参数配置:原来下面两个参数配置都是1024M
HistoryCacheSize=1536M         CacheSize=1536M



页: [1]
查看完整版本: zabbix使用过程中遇到的问题与解决方法