设为首页 收藏本站
查看: 2126|回复: 0

[经验分享] 一次HP 阵列卡排障

[复制链接]
累计签到:2 天
连续签到:1 天
发表于 2014-11-18 09:28:52 | 显示全部楼层 |阅读模式
                      公司使用的是HP gen8机器,用的是p420i阵列卡,同时在系统的另一端,nagios监控系统配合nrpe脚本check_hpasm定期检测硬件健康。

最近为了让机器更带劲,加上了SSD硬盘,机械硬盘仅用作大容量存储,在感受速度与激情的同时,悲剧接踵而至。

nagios 监控报警,硬件出错:
1
2
CRITICAL - da controller 1 in slot 1 needs attention, System: 'proliant dl3x0e gen8', S/N: 'CN74xxxxx', ROM: 'P73 12/20/2013'
Performance Data:  pc_1=65 fan_5=27% fan_6=27% fan_7=27% fan_8=27% temp_1_ambient=23;42;42 temp_2_cpu#1=40;70;70 temp_4_memory_bd=24;87;87 temp_6_memory_bd=25;80;80 temp_7_memory_bd=26;80;80 temp_8_memory_bd=26;80;80 temp_9_memory_bd=25;80;80 temp_10_memory_bd=25;80;80 temp_11_memory_bd=26;80;80 temp_12_system_bd=35;60;60 temp_13_system_bd=44;105;105 temp_14_system_bd=33;95;95 temp_17_power_supply_bay=26;80;80 temp_18_power_supply_bay=25;80;80 temp_19_system_bd=25;110;110 temp_20_system_bd=21;110;110 temp_21_system_bd=24;110;110 temp_22_system_bd=26;110;110 temp_23_system_bd=21;65;65 temp_26_system_bd=35;100;100 temp_28_system_bd=28;90;90 temp_29_i/o_zone=85;100;100 temp_31_i/o_zone=32;80;80 temp_32_i/o_zone=25;80;80 temp_33_system_bd=32;80;80 temp_34_system_bd=30;80;80 temp_35_system_bd=30;80;80 temp_36_system_bd=31;80;80 temp_37_system_bd=29;80;80




由于报警内容非常含糊,像是一颗***,根本不敢将机器正式投入运营,不得不将机器从机房运回来仔细测试。感觉是硬件故障,但是替换了阵列卡甚至重装了N次操作系统之后,依然报相同的错误。如果不用SSD,只使用普通硬盘,就不会报错。

最终的问题定位到了HP 阵列卡里的HP SSD smart path 功能,该功能可以加速SSD盘读写,有点混合硬盘的味道,即当作机械硬盘的缓存。但是很抱歉,如果你使用SSD硬盘安装操作系统的话,会有上面的报错。

解决办法:
1
2
yum install http://downloads.linux.hp.com/SD ... 2.0-22.0.x86_64.rpm http://downloads.linux.hp.com/SD ... 0-22.0.x86_64.rpm-y
/usr/sbin/hpssacli controller slot=1 array a modify ssdsmartpath=disable



hpssacli-2.0-22.0.x86_64.rpm ,经过测试,这个包centos 6/7 都适用。

也可以开机根据提示按F5进入阵列卡的图形管理界面来禁用该功能。
                   


运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-30924-1-1.html 上篇帖子: 主板故障导致服务器不定时频繁重启故障解决过程全记录 下篇帖子: HP DL380 G5频繁自动关机,PPM灯红色!
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表