一、不同的zabbix版本,不能支持完整的模版导入导出。
旧的zabbix是2.2.0版本,新的zabbix是2.2.9,想把原来的监控模版导过来,结果失败了。
总结了几点不同之处:
1、操作符不兼容: 旧版:与:and;或 or;不等于 <> ; 新版:与:& ;或 | ;不等于 # ;
2、不兼容最频繁的地方在trigger。可以将旧模版导出来后,把.xml文本里的trigger部分删掉,尝试导入。一般情况下,Item部分可以导入。
二、磁盘监控报警范围不对
原来的zabbix监控平台中,对于disk的监控,需求是,home、root等目录磁盘空间不足时,报警。但是实际情况是,很多子目录均告警,比如/sys、/home/rpm/等磁盘空间小于5%。正常情况下,这些磁盘不列在监控范围。 原因: 没有增加相应的filter。(对比时发现了这个filter,但旧版的filter是单独一个分页,新版里没有找到分页,所以当时就没增加。) 解决方法: 增加filter。将所有报错的host全部delete并重新增加host后,监控正常。
三、创建新模版界面err信息 创建新的模版时,创建界面有如下报错,但并不影响模版的创建: array_combine():Both parameters should have at least 1 element [templates.php:464 →CView->render() → include() →array_combine() in/var/www/zabbix/include/views/configuration.template.edit.php:173]
原因: 提示模版中至少应该增加host或group一项信息。 解决方法: 将新建的模版增加到TEMPLATES组后,不显示该报错了。
一、旧版本中很多trigger不能用,比如下面的一个trigger expression是这样的::system.cpu.load[percpu,avg5].avg(5m)}>{$CPU_LOAD_NUM_W_GT_N},其中,CPU_LOAD_NUM_W_GT_N不是具体的数值
原因: 这些是宏定义的macros值,模版虽然迁移过来了但是这些宏定义的macros值并未进行设置。 解决方法: Administration → General → Macros,添加各个macros值。
二、新增的host不能自动链接模版和添加group信息
原因: 没有相应的自动发现规则 解决方法: 根据需求创建自动发现的action,可以根据host的name规范,检查其中的关键字,比如:hostname中带有mysql字样的host自动添加到mysql模版
三、proxy上挂了100+台 host时,proxy挂了
原因: Proxy挂了,查看日志,发现是内存溢出 [iyunv@Proxyzabbix]# tail -10 zabbix_proxy.log 18569:20151201:164406.815 __mem_malloc: skipped 0 asked 104 skip_min4294967295 skip_max 0
18569:20151201:164406.815 [file:dbconfig.c,line:410]zbx_mem_malloc(): out of memory (requested 103 bytes) 18569:20151201:164406.815 [file:dbconfig.c,line:410]zbx_mem_malloc(): please increase CacheSize configuration parameter 18558:20151201:164406.957 One child process died (PID:18569,exitcode/signal:255).Exiting ... 18558:20151201:164408.960syncing history data... 18558:20151201:164409.088syncing history data done 18558:20151201:164409.088Zabbix Proxy stopped. Zabbix 2.2.2 (revision 42525). 解决方法: vimzabbix_proxy.conf,修改cachesize的值。原来使用了默认值8M,现在修改为1024M ###Option: CacheSize # Size of configuration cache, in bytes. # Shared memory size, for storing hostsand items data. # #Mandatory: no #Range: 128K-2G #Default: #CacheSize=8M CacheSize=1024M
一、zabbix-proxy监控报错:Zabbix unreachable poller processes more than75% busy。
原因: Zabbix-proxy服务器负载增加,导致内存、IO等分配不足 解决方法: 调整参数StartPollers=260(原来是160),重启proxy
问题2: 调整完参数后,proxy又挂了。查看日志:
[iyunv@DB_Proxyzabbix]# tail -10 /var/log/zabbix/zabbix_proxy.log 49952:20151202:134331.419 [Z3001] connection todatabase 'zabbix' failed: [1040] Too many connections 49949:20151202:134331.419 [Z3001] connectionto database 'zabbix' failed: [1040] Too many connections 49952:20151202:134331.419 Cannot connect tothe database. Exiting... 49949:20151202:134331.419 Cannot connect tothe database. Exiting... 49968:20151202:134331.419 [Z3001] connectionto database 'zabbix' failed: [1040] Too many connections 49968:20151202:134331.419 Cannot connect tothe database. Exiting... 49401:20151202:134331.420 One child processdied (PID:49952,exitcode/signal:255). Exiting ... 49401:20151202:134333.423 syncing historydata... 49401:20151202:134333.468 syncing history datadone 49401:20151202:134333.468 Zabbix Proxystopped. Zabbix 2.2.2 (revision 42525). 原因: Mysql数据库连接数不足 解决方法: 调整my.cnf中max_connection=1000(原来是350),重启mysql服务,重启proxy
二、邮件一直报Zabbix agent on {HOST.NAME} is unreachable for 5 minutes。Host不固定。
zabbix_Proxy端主机挂了约300台,Zabbix proxy出现了严重的性能问题,有些数据获取不到,或者图形会缺数据。 尝试了更新proxy服务器配置,原来的proxy机器是R410,内存16G,换成R710,内存32G。还是一直报这个错误。 最后百度的解决方案是: 1、修改每一个 item 的监控模式,Item勾选后,下面选择Mass Update,go进入页面将type修改为zabbix agent(active)模式。
2、Proxy配置调整 StartPollers=450; StartTrappers=200;
3、原来mysql的my.cnf中的innodb buffer pool size配置过多,12G,改为4G
三、部分数据比如: 磁盘I/O利用率,proxy服务器get可以获取到,但web页面no data,不出图。
zabbix监控页面,显示nodata,在proxy linux服务器使用 zabbix get key值可以获得,比较慢,需要3-4秒时间,但是能获得结果
原因: 还是内存的问题。 解决方法: 调整proxy参数配置:原来下面两个参数配置都是1024M
HistoryCacheSize=1536M CacheSize=1536M
|