设为首页 收藏本站
查看: 1587|回复: 0

[经验分享] 使用zabbix discovery监控网卡百兆

[复制链接]
累计签到:1 天
连续签到:1 天
发表于 2014-4-11 09:59:03 | 显示全部楼层 |阅读模式
最近在review一些基础监控项,发现有部分基础的监控缺失,比如disk usage,network card相关的监控。
因为机器的配置不同,不太好配置一个统一的模板,不过在新版本的zabbix中有个功能Low-level discovery,可以根据主机的配置自动生成需要的监控,只需要传入宏变量即可。
比如监控每个网卡的出流量net.if.out[{#IFNAME}],监控网卡的speed os.get[NetworkCardSpeed,{#IFNAME}]
有些情况下网卡会从1000M变成100M,因此添加了相关的trigger:
{os.get[NetworkCardSpeed,{#IFNAME}].last(0)}<1000
这里有两个细节的问题:
1)新版本的network card speed的item是os.get[NetworkCardSpeed,xxxx],在网卡的speed为unknown时,其结果是0。


zabbix_get -s 127.0.0.1 -k 'os.get[NetworkCardSpeed,eth2]'
为了排除这种情况,更改trigger为如下规则:


{os.get[NetworkCardSpeed,{#IFNAME}].last(0)}<1000 &
{os.get[NetworkCardSpeed,{#IFNAME}].last(0)}#0
可以通过如下sql查看speed 为100M的机器:


select
distinct(a.host),c.ip,b.name,b.lastvalue from hosts a,items b,
interface c where a.hostid=c.hostid and a.hostid=b.hostid and
b.key_ like 'os.get[NetworkCardSpeed%' and b.lastvalue='1000';
2)关于bonding
由于datanode的shuffle阶段需要大量的网络操作,很容易出现网卡瓶颈,因此datanode一般会做网卡的bonding,常用的模式是6,根据原理来看outgoing和incoming的流量大致应该是相同的,但实际情况下看到,outgoing的流量一般是比较平均,而incoming的流量相差很大,下面是一个sar的结果:


14时24分28秒     IFACE   rxpck/s   txpck/s   rxbyt/s   txbyt/s   rxcmp/s   txcmp/s  rxmcst/s
14时24分29秒      eth0      6.93  28139.60    473.27 41837599.01      0.00      0.00      6.93
14时24分29秒      eth1  29448.51  31732.67 1929669.31 47286517.82      0.00      0.00      6.93
14时24分29秒     bond0  29455.45  59872.28 1930142.57 89124116.83      0.00      0.00     13.86
另外,如果一个网卡由1000M变为100M也不会出现短板效应(之前一直以为会出现短板效应),而是根据speed的情况来做流量分发,speed大的流量大,speed小的流量小。

另外注意bonding配置中miimon参数的含义,它是检测的server到switch的直连链路问题,如果switch的上层链路出问题是不会work的。交换机链路的ha就需要考虑以太通道等技术了。。



运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-17100-1-1.html 上篇帖子: zabbix监控java的方法 下篇帖子: zabbix的web端配置 discovery
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表