设为首页 收藏本站
查看: 2144|回复: 0

[经验分享] zabbix企业应用之服务器硬件信息监控

[复制链接]
累计签到:1 天
连续签到:1 天
发表于 2015-5-6 09:25:53 | 显示全部楼层 |阅读模式
之前介绍的zabbix监控都是属于监控服务方面,现在介绍一下zabbix监控服务器硬件信息的。
由于我公司服务器都是使用dell(我公司是手游方面,服务器全部是dell),服务器型号有r410、r420、r710、r720,系统有centos 5.x、centos 6.x 、redhat 5.x、redhat 6.x、ubuntu 12.04、ubuntu 12.04.4等版本,对于硬件监控,我测试过ipmi、megacli、smart等,但这些监控软件的监控内容都比较少,没有通用的那种,最后找到了dell专门的omsa,满足了我的需求,下面就介绍一下使用omsa来监控dell服务器的硬件信息。
目前我监控以下的硬件信息:
1、cpu处理器状态

2、cpu省电模式状态(如果开启了省电模式,在压力大的时候,会很卡的)
3、raid状态(比如做了哪个raid模式,raid状态是否正常)
4、内存状态(可以查看当前服务器最大支持多少内存,当前多少内存,如果内存有问题,可以显示哪个位置内存故障)
5、机器温度状态(监控机器的温度是否超过阀值)
6、物理硬盘状态(监控物理硬盘是否有故障)
7、电源状态(是单电还是双电,是否有故障)
8、系统面板CMOS电池(cmos电池是否有故障)
9、网卡状态(当前的网卡数量,以及网卡是否有问题)
10、风扇(当前的风扇数量,以及是否有故障)
默认是cpu省电模式监控关闭报警,其他的监控都是15分钟监控一次,如果连续2次都有问题则报警通知。
下面是监控图
1、硬件正常的服务器监控截图

wKioL1NdxYuAFlirAAQxcbtC95U846.jpg
2、部分硬件不正常的监控图
wKiom1NdxmOSUNQSAARq-q-aIyU215.jpg 可以看到此服务器的cpu开启了省电模式,并且内存条有问题
经过命令行查看,发现有问题的内存条是第一个插槽
wKioL1NdxmbyfKYWAADg1vjYLso218.jpg
下面是安装方法:
一、客户端
A.在redhat或者centos系统里安装
1、安装dell的yum源

1
wget -q -O - http://linux.dell.com/repo/hardware/latest/bootstrap.cgi | bash



2、安装omsa
1
yum install srvadmin-all



3、做软连接
1
2
ln -s /opt/dell/srvadmin/sbin/omreport /usr/bin/omreport
ln -s /opt/dell/srvadmin/sbin/omconfig /usr/bin/omconfig



4、关闭web模式(仅允许运行cli)
1
echo "/usr/bin/omconfig system webserver action=stop" >>/opt/dell/srvadmin/sbin/srvadmin-services.sh



5、启动omsa
1
/opt/dell/srvadmin/sbin/srvadmin-services.sh start



6、把omsa加入到开机启动里
1
echo "/opt/dell/srvadmin/sbin/srvadmin-services.sh start">>/etc/rc.local



以上是在centos或者redhat系统里安装omsa。
B.下面是在ubuntu下的安装
1、增加源
1
echo 'deb http://linux.dell.com/repo/community/ubuntu precise openmanage' | sudo tee -a /etc/apt/sources.list.d/linux.dell.com.sources.list



2、检测与增加key
1
2
gpg --keyserver pool.sks-keyservers.net --recv-key 1285491434D8786F
gpg -a --export 1285491434D8786F | sudo apt-key add -



3、更新源
1
apt-get update -y



4、安装omsa
1
apt-get install srvadmin-all -y



5、做软连接
1
2
ln -s /opt/dell/srvadmin/sbin/omreport /usr/bin/omreport
ln -s /opt/dell/srvadmin/sbin/omconfig /usr/bin/omconfig



6、启动cli模式omsa
1
service dataeng start



C.zabbix客户端的配置
1、下面是在zabbix_agentd.conf里配置
1
2
3
4
5
6
7
8
9
10
11
#follow is monitor hardware
UserParameter=hardware_battery,omreport chassis batteries|awk'/^Status/{if($NF=="Ok") {print 1} else {print 0}}'
UserParameter=hardware_cpu_model,awk-vhardware_cpu_crontol=`sudoomreport chassis biossetup|awk'/C State/{if($NF=="Enabled") {print 0} else {print 1}}'` -vhardware_cpu_c1=`sudoomreport chassis biossetup|awk'/C1[-|E]/{if($NF=="Enabled") {print 0} else {print 1}}'` 'BEGIN{if(hardware_cpu_crontol==0 && hardware_cpu_c1==0) {print 0} else {print 1}}'
UserParameter=hardware_fan_health,awk-vhardware_fan_number=`omreport chassis fans|grep-c "^Index"` -vhardware_fan=`omreport chassis fans|awk'/^Status/{if($NF=="Ok") count+=1}END{print count}'` 'BEGIN{if(hardware_fan_number==hardware_fan) {print 1} else {print 0}}'
UserParameter=hardware_memory_health,awk-vhardware_memory=`omreport chassis memory|awk'/^Health/{print $NF}'` 'BEGIN{if(hardware_memory=="Ok") {print 1} else {print 0}}'
UserParameter=hardware_nic_health,awk-vhardware_nic_number=`omreport chassis nics |grep-c "Interface Name"` -vhardware_nic=`omreport chassis nics |awk'/^Connection Status/{print $NF}'|wc-l` 'BEGIN{if(hardware_nic_number==hardware_nic) {print 1} else {print 0}}'
UserParameter=hardware_cpu,omreport chassis processors|awk'/^Health/{if($NF=="Ok") {print 1} else {print 0}}'
UserParameter=hardware_power_health,awk-vhardware_power_number=`omreport chassis pwrsupplies|grep-c "Index"` -vhardware_power=`omreport chassis pwrsupplies|awk'/^Status/{if($NF=="Ok") count+=1}END{print count}'` 'BEGIN{if(hardware_power_number==hardware_power) {print 1} else {print 0}}'
UserParameter=hardware_temp,omreport chassis temps|awk'/^Status/{if($NF=="Ok") {print 1} else {print 0}}'|head-n 1
UserParameter=hardware_physics_health,awk-vhardware_physics_disk_number=`omreport storage pdisk controller=0|grep-c "^ID"` -vhardware_physics_disk=`omreport storage pdisk controller=0|awk'/^Status/{if($NF=="Ok") count+=1}END{print count}'` 'BEGIN{if(hardware_physics_disk_number==hardware_physics_disk) {print 1} else {print 0}}'
UserParameter=hardware_virtual_health,awk-vhardware_virtual_disk_number=`omreport storage vdisk controller=0|grep-c "^ID"` -vhardware_virtual_disk=`omreport storage vdisk controller=0|awk'/^Status/{if($NF=="Ok") count+=1}END{print count}'` 'BEGIN{if(hardware_virtual_disk_number==hardware_virtual_disk) {print 1} else {print 0}}'



2、重启zabbix_agentd服务
1
2
ps-ef|grepzabbix|grep-vgrep|awk'{print $2}'|xargskill-9
/usr/local/zabbix/sbin/zabbix_agentd-c /usr/local/zabbix/conf/zabbix_agentd.conf



如果需要在其他系统里安装,请参看官方wiki,地址是http://linux.dell.com/wiki/index.php/Repository/hardware

如果是windows系统,可以参考zabbix企业应用之windows系统安装omsa硬件监控
二、服务端
1、模板导入
把Template Hardware Monitor导入到zabbix里(模板在附件),具体操作不介绍。
2、主机关联模板
把需要监控的硬件服务器关联此模板即可
百度云附件:zabbix监控硬件服务器模板.xml   


运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-64095-1-1.html 上篇帖子: zabbix企业应用之centos7安装硬件监控 下篇帖子: zabbix 监控tcp连接的状态 服务器 监控 信息 硬件
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表