设为首页 收藏本站
查看: 1045|回复: 0

[经验分享] Cisco B200 M3刀片服务器Discovery失败故障处理

[复制链接]
累计签到:1 天
连续签到:1 天
发表于 2016-1-7 10:14:56 | 显示全部楼层 |阅读模式
客户刀片服务器升级,购买了两台Cisco B200 M3,到货后我们查看了一下B200 M3的版本,然后对UCS Manager进行了升级,可是升级完之后发现这两台刀片服务器在Discovery过程中,只走到了7%就失败了!如下图所示:

QQ截图20160107101426.jpg
另外,查看报警信息和思科文档如下:
QQ截图20160107101434.jpg
QQ截图20160107101442.jpg
看上图的文档也没有得到有用的信息。问题究竟出在哪里?为了进一步求证,我们做了如下操作:
1、取下刀片服务器,只安装一颗CPU和一条内存。在这种状态下服务器可以discovery通过。
2、安装两颗CPU和两条内存,此时故障现象依旧,还是无法通过。
3、将CPU1和CPU2对换,CPU2是单独下单的,CPU1是随刀片一起过来的,只安装CPU2和一条内存了,discovery过程可以通过。
4、将原有的一台B200 M3的内存全部拆下和现有内存互换,安装两颗CPU,discovery过程还是无法通过。
5、只在CPU2的槽位上安装一颗CPU和一条内存,仍然不行(后来得知,在只有一颗CPU的情况下,只能插在CPU1槽1上)
6、将刀片更换槽位,也不行……
7、Recover,也不行……
………………

试了种种仍然不行,初步判断问题可能是出在主板上,于是带着这个疑问向思科开了一个case,后来思科TAC工程师收集了一下日志,根据日志判断问题也可能出在主板上。最终帮我们做了一个RMA,重新发两块主板过来!
期待总是美好的,可那毕竟只是期待!
待RMA的两块主板到达后,我们把CPU、内存等部件插好后,插入刀箱,见鬼的事情再次出现了,discovery过程仍然是走到7%就不动了!两块都是这样!
感觉不符合常理,但是问题还是出现了!
我们将出现的问题汇报给了大BOSS,大BOSS也深感疑惑,不可能发来的都是坏的啊!于是元旦后的第一天大BOSS亲临现场。
大BOSS通过一翻查看,发现这两台刀片的boardcontroller的firmware没有显示版本显示,也就是看不出来是什么版本,会不会是因为这个导致的问题呢?于是通过SSH登录UCS Manager,进行了如下操作:
C6248A-A# scope chassis 2
C6248A-A /chassis # scope server 6
C6248A-A /chassis/server # scope boardcontroller
C6248A-A /chassis/server/boardcontroller # activate firmware 14.0
Warning: When committed this command will reset the end-point
C6248A-A /chassis/server/boardcontroller # commit-buffer
待刀片再次发现时竟然通过了那个7%,直至发现成功!至此,RMA过来的那两台刀片所出现的问题得以解决!
大BOSS出马,哇嘎嘎……(*^*)


两台刀片正常之后,我们在想另外两台是不是也是因为这个原因呢?于是我们再一翻折腾,把原来的一台刀片服务器再次插入刀箱,进行检查。然而事于愿违,最终不得不将故障刀片发走!
**********************************************************************************************
总结:
1、故障处理必须要细心,不能放过每一个环节。
2、不要用惯性思维对待每一个故障,猪是撞到树上死的,可是兔子不一定是撞到树上死 。我和同事在对待RMA的刀片上就犯了这个错误。

3、处理故障时要把事情缕顺了!一点点来,一步步走!

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-161330-1-1.html 上篇帖子: Cisco N7K 四层模块式交换机 下篇帖子: Windows Server Team Bonding与Cisco交换机端口聚合实现高可用 服务器 Cisco
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表