CloudStack异常状态恢复&计划内开关机顺序
CloudStack在遇见突发的停电或断网情况下,有可能出现很多异常的状态,如主机存储的警告状态,虚拟机不能正常运行或启动。在运营维护中,为了保证CS内个物理设备和VM的状态稳定,我这里有一个关机顺序的建议。
[*]在UI上关闭所有的VM。
[*]在UI上将主存储进入维护模式,再等待所有系统虚拟机也关机。
[*]在UI上将host进入维护模式,
[*]关闭CS服务。
[*]关闭mysql数据库
[*]关闭相关硬件设备
重启的时候用相反的操作进行就可以。以上步骤是在计划内停机的情况下做的操作。
如果是突然断电造成VM不能启动,大部分是由于存储原因,或host同步状态问题造成的,需要看log分析,一般也都能恢复回来。
[*]出现问题后,需要检查的几个地方:
[*]存储的运行状态
[*]存储和Hypervisor的连接状态
[*]Hypervisor和管理节点的连接状态
[*]如果相互连接都没有问题,可以尝试在UI上将主机进入维护模式,再退出。或者直接进入DB将主机的状态直接改为UP。
但如果人品不好,因为断电造成存储或VM的镜像文件损坏,恢复的可能就很低了。如果因为镜像文件损坏,Hypervisor会有直接提示写入CloudStack的log用于分析。这时只能找Hypervisor相关的恢复操作来进行解决。
页:
[1]