本帖最后由 jeffluo 于 2017-5-4 11:41 编辑
实验环境Windows 2012 R2 Hyper-V
网络类型一般分类:心跳网络、数据网络、存储网络 心跳网络在群集管理员的设置:
专用于VM的在线迁移,参加VM灾难迁移的仲裁。 说明: 心跳线单独断开后不会影响群集的当前运行,但会导致在线迁移变慢或无法执行,可见心跳线是群集主机的其中一个仲裁条件,当心跳线故障时不能构成主机切换的必然条件。 数据网络在群集管理员的设置:
VM对外提供服务的网络。 说明: 数据网络断网后会在10s后触发迁移切换,而当该主机的数据网络恢复后,已切换的VM不会切换回来。 存储网络在群集管理员的设置:
直连共享存储的网络。 说明: 如果存储网络是由用两条10G网线组成的Nic Team构成,当单独断其中一条存储网络不对会群集产生影响,经测试交替断线的时间间隔可以在5s之外,不会有影响。 当两条存储线都断开时,该主机上的VM会全部失联,且不能触发主机的切换。如果存储网络不能恢复的话,该主机上的VM将永远失联。对此必须要保障每台主机的存储网络是高可用的,否则将存在单点故障。目前的做法是,每主机必须最少有2条件存储网线,且此2条存储网络最好能跨两个独立的存储交换机。 另发现一个情况是,即使VM不能切换,但VM的运行状态得以保存,当存储网络恢复后VM不会触发重启,只是系统日志中会报IO错误。但后期发现这些VM已无法正常提供服务,而必须要手动重启一下才能恢复正常。 总结和已发现的问题:l 当其中一台主机重启时,如果另一台主机不能正常接收重启主机的VM时,那些VM有部份会在群集中“消失”并显示异常中断的情况,且无法通过开启指令使那些VM重新启动,当该主机重启完成后消失的VM也不能重现,必须要将另一台负责接收迁移VM的主机也同时重启,“消失”VM才能恢复,异常中断的VM也会恢复,但要注意此时VM是以分配内存来重启,如果当时的内存不足以分配内存则会出现资源不足无法打开VM的情况。 l 由当异常断网触发的主机切换所致的VM迁移会引发VM的重启,如果VM上的程序没有设置为自动登陆和自动打开程序的话就会出现业务中断的情况。 l 当VM重启后内存会以初始分配的内存来计算资源,而不是以实际使用量来计算,此时如果在单台主机内存不足以分配启动内存时就会有部份VM无法正常启动,所以计算资源时应以预分配的资源配额来计算,当单台主机无法承担切换后的资源分配,将会出现业务中断的情况。
|