杨叔叔 发表于 2019-1-11 10:33:21

Cacti或CactiEZ常见断图原因分析

  不管是哪种Cacti或CactiEZ,很多人都是遇到断图问题,生成的图形会断断续续.
  总结原因:
  如果图形断断续续,那么很有可能是Cacti或CactiEZ本身出了问题,常见问题原因如下:
  1 时间问题,如果使用虚拟机安装Cacti或CactiEZ,都有可能遇到Guest系统和Hypervisor系统时间不一致的问题,而Guest时间可能时快时慢,直接导致图形断断续续.
  判断方法:
  登录系统,然后重复使用date命令检查时间,如发现时间时快时慢,可判定是时间问题导致图形断断续续.
  解决办法:
  Xen虚拟机,登录Guest系统,添加:
  xen.independent_wallclock = 1
  到/etc/sysctl.conf
  然后执行:sysctl-p
  然后Guest系统的时间就可以使用ntpdata命令与时间服务器同步了.
  VMware虚拟机,登录Hypervisor,编辑Guest系统对应的.vmx文件,将:
  tools.syncTime = "FALSE"
  改成:
  tools.syncTime = "TRUE"
  然后Guest系统的时间就可以跟Hypervisor同步了,再将Hypervisor与时间服务器同步就可以解决时间问题了
  2 采集问题,可能在某些时候,Cacti或CactiEZ的负载太高或需要采集的数据相对效多,而导致一个采集周期内无法完成所有数据的采集,从而使得图形断断续续.
  判断方法:
  登录Cacti或CactiEZ,查看日志,如果有提醒超过300秒之类的错误日志,可判定是采集问题导致图形断断续续.
  解决方法:
  1 提高采集器周期(不建议)
  2 提高Cacti或CactiEZ的处理器性能
  3 增加采集进程数量
  4 减少监控对象
  如果以上4种办法中的1种能解决问题,则可以肯定断图原因
  3 网络问题或被监控主机问题,可能在某些时候,Cacti或CactiEZ与被监控主机之间的网络有问题,如防火墙等因素,导致Cacti或CactiEZ不能访问被监控主机的udp端口161.导致断图,或完全无数据.
  判断方法:
  登录Cacti或CactiEZ,使用:
  snmpwalk -v2c -c public 127.0.0.1 .sysDescr
  检查Cacti或CactiEZ是否能正常访问被监控主机的snmp.(public应该为被监控主机的snmp的团体字;127.0.0.1应为被监控主机的IP地址或主机名)
  如能出现类似以下数据则为正常:
  SNMPv2-MIB::sysDescr.0 = STRING: Linux localhost.localdomain 2.6.18-194.el5 #1 SMP Tue Mar 16 21:52:39 EDT 2010 x86_64
  如果看不到任何数据或有其它报错,则说明Cacti或CactiEZ无法访问被监控主机的snmp信息.
  而出现这种情况的可能性有:
  1 被监控主机没有开启snmp服务.
  判断方法:
  登录被监控主机
  Linux使用:
  netstat -nlu
  命令检查本机是否已打开udp端口161,如结果中包含:
  udp      0      0 0.0.0.0:161               0.0.0.0:*
  则说明本机已经开放udp端口161,并允许任何IP访问,如果没有,则说明本机没有开放snmp服务
  Windows使用:
  netstat -nap udp
  命令检查本机是否已打开udp端口161,如结果中包含:
  UDP    0.0.0.0:161            *:*
  则说明本机已经开放udp端口161,并允许任何IP访问,如果没有,则说明本机没有开放snmp服务
  解决办法:
  启动snmp服务
  2 被监控主机的防火墙阻止了Cacti或CactiEZ访问UDP端口161.
  判断方法:
  时间关闭防火墙
  Linux可使用:
  service iptables stop
  停止iptables服务,或:
  iptables -F
  iptables -X
  清除iptables策略和自定义链

页: [1]
查看完整版本: Cacti或CactiEZ常见断图原因分析