Vmware vSphere常见问题汇总

cheng029 · 发表于 2012-7-11 19:28:31

1、启连接服务器提示无法验证服务器
故障内容：
在对VMware View 5.0进行安装后，进行VMware View连接时总会提示我们如下：

虽然我们可以通过继续来进行连接，但是这一提示看的我们不爽。
解决方法：
通过如下简单的方法可以去除这一提示，在进行连接时，点击选项会出现如图所示：

点击配置SSL选项框，勾选如图所示的选项框，确定后即可去除提示；

1. 在进行登录，提示如下图所示：

2、部署linked clone虚拟桌面失败，提示如下错误提示：“View Composer agent initialization state error (18): Failed to join the domain”故障状态：
1、部署linked clone虚拟桌面失败，提示如下错误提示：
View Composer agent initialization state error (18): Failed to join the domain
2、在composer日志里，能看到类是如下错误信息：
2010-08-24 14:14:02,509 [3280] FATAL CSvmGaService - [svmGaService.cpp, 116] Domain join failedError 5 (0x5): Access is denied.
2010-08-24 14:15:19,835 [328] FATAL CSvmGaService - [svmGaService.cpp, 116] Domain join failedError 5 (0x5): Access is denied.
2010-08-24 14:16:37,317 [2432] FATAL CSvmGaService - [svmGaService.cpp, 116] Domain join failedError 5 (0x5): Access is denied.
2010-08-24 14:27:10,213 [1900] FATAL ExceptionTranslator - [SvmStateMachine.h, 219] Domain Join failed even with maximum number of retriesError 0 (0x0): The operation completed
3、在Connection Server日志文件里，有类似如下信息：
2010-08-24 14:11:01,004 DEBUG [VirtualCenterDriver] Initial configuration on VM /Training/vm/test2/WSGLTV1 succeed. machine.id: vdi.broker.useSvi=1;vdi.broker.brokerPublicKey=MIHwMIGoBgcqhkjOOAQBMIGcAkEA/KaCzo4Syrom78z3EQ5SbbB4sF7ey80et
KII864WF64B81uRpH5t9jQTxeEu0ImbzRMqzVDZkVG9xD7nN1kuFwIVAJYu3cw2nLqOuyYO5rahJtk0bjjFAkBnhHGyepz0TukaScUUfbGpq
DTWSGkx0tFCcbnjUDC3H9c9oXkGmzLik1Yw4cIGI1TQ2iCmxBblC+eUykBBYCFANl5tlAbbdew2tywpHVz8bhYkLY;vdi.broker.disconnecttimeout=-1;vdi.broker.singleuse=0;vdi.broker.useSysprep=0;vdi.broker.poolDn=cn=test2,ou=server groups,dc=vdi,dc=vmware,dc=int
2010-08-24 14:27:17,016 ERROR [VmInformation] The VM: /Training/vm/test2/WSGLTV1 - encountered an error: 8/24/10 2:27:17 PM EDT: View Composer agent initialization state error (18): Failed to join the domain (waited 810 seconds) 2010-08-24 14:27:17,021 DEBUG [EventLogger] Info_Event:[BROKER_PROVISIONING_SVI_ERROR_COMPOSER_AGENT_INIT_FAILED] "Provisioning error occurred for Machine WSGLTV1: View Composer agent initialization failed": Source=com.vmware.vdi.desktoptracker.VmInformation, Time=Tue Aug 24 14:27:17 EDT 2010, Severity=ERROR, Node=GL-VDIVIEW-01.fletc.dmz, MachineName=WSGLTV1, Module=Broker, Acknowledged=true 2010-08-24 14:27:17,048 DEBUG [VmInformation] ::Updating VM state /Training/vm/test2/WSGLTV1 ERROR
ERROR: 8/24/10 2:27:17 PM EDT: View Composer agent initialization state error (18): Failed to join the domain (waited 810 seconds)
故障分析
这个问题就是由于模板虚拟机需要打上相应的补丁才行；
解决方案
在创建Windows 2008的OU时如果勾选了Protect container from accidental deletion选项，这回有这个情况，Everyone用户组没有权限，所以，需要打上相关的补丁即可，参考：944043。
http://support.microsoft.com/kb/944043/en-us

3、PCoIP连接时不能跨两个显示器显示故障状态：在View machines中运行Windows 7,可能会遇到以下问题:
1、当使用PCoIP协议来配置多显示器时，显示画面不能跨多个显示器
2、显示器上只显示半边画面
3、使用RDP连接时没有问题，可是使用PCoIP时，另外一个显示器没有显示任何信息
解决方法：
1) 在桌面池设置里面，确保选择了最多的显示器数量以及最大的分辨率 .

2) 确认桌面池用户所使用显示器的最大分辨率没有超过池子中设置的最大分辨率

3) 如果桌面是Win7的话，运行msconfig.exe 去掉启动项中的No GUI boot 和Base Video 选项（以下是WinXP实例）

4、确认桌面资源池Desktop Pool存在故障状态
1、无法连接到虚拟桌面；
2、View Client提示如下错误信息：There are no available resources；
故障分析
一般都是由于协议设定、资源池创建、权限分配和版本匹配等方式导致；
解决方案
确认desktop pool存在与否：
1、利用http://主机名/admin命令登录到VMware View Administrator，看看能否看到Global desktop和资源池；
2、在出现的资源池列表中查找想要连接的资源池否存在，如果没出现列表或不存在则表示desktop pool有问题；
权限问题：
权限的分配不当也可能导致资源池不显示，下面是权限确认步骤：
1、照例用http://主机名/admin命令登录到VMware View Administrator，看看能否看到Global dekstop和资源池；
2、点击desktop pool；
3、点击Entitlements定位到desktop pool的Summary页标签。在Entitlements向导会显示这个资源池的所有权限授予者；
4、点击Add然后选定需要添加到desktop pool的用户或用户组；

5、访问View Security服务器失败：Give final block not properly padded故障状态
1、从外网访问VMware View Security Server失败；
2、系统提示如下错误提示：Page can not be displayed
3、这种错误一般出现在采用SSL做为加密认证通信时；
4、在C:\program files\vmware\vmware view\server\sslgateway\config\的debug-xxx.txt里有类是如下错误信息：failed to decrypt safe contents entry: javax.crypto.BadPaddingException: Given final block not properly padded
故障分析
这种情况一般都是忧郁key.p12文件异常或密码不对导致；
解决方案
1、确认locked.properties文件无误，打开验证里面的如下字段信息：
1. keyfile=<key.p12 file>
2. keypass=<password>
2、确认key.p12文件呜呜，如果有问题，则生成一个新的即可

23、vSpherer4.1中32位win2003会不定时的关机，关机后无法再次登录
故障现象：客户的X86 Windows2003VM系统在使用中会不定时的关机。关机时间不确定，几个小时到几天，关机瞬间就像物理机断电一样，关机后的VM能再次开启，但只要输入账号和密码就立即关机，连安全模式也一样状况。其他X64VM系统没有任何问题。
解决方法：通过两个月的煎熬，排除了网络病毒、物理硬件和系统版本的原因，通过不断的分析ESXi和主机日志，发现有类似如下日志

Sep 07 01:45:03.709: mks| SOCKET 10 (91) recv error 104: Connection reset by peer

Sep 07 01:45:03.709: mks| SOCKET 10 (91) destroying VNC backend on socket error: 1

Sep 07 03:26:42.676: vmx| Vix: [10666095 mainDispatch.c:907]: VMAutomation_PowerOff: Powering off. （VM Powering off）
通过400长期的周旋，发现这是7月底发现的BUG,通过在ESXi主机下输入命令：
/etc/init.d/sfcbd-watchdog stop
chkconfig sfcbd-watchdog off
chkconfig sfcbd off
问题解决，但VC上插件和监控状态失效，去官网（http://kb.vmware.com/selfservice/microsites/search.do?cmd=displayKC&docType=kc&docTypeID=DT_KB_1_1&externalId=2000609）下载最新补丁，安装，一切OK。

24、VM（windows2003）全屏最大化后，鼠标移动缓慢或错位
解决方法：
1、查看是否安装VMware-tools
2、查看系统内硬件加速是否开启（完全）
3、将虚拟机分辨率调整为：800x600
4、到控制台中打开，上面菜单栏中à视图à自动匹配窗口勾去掉
5、查看虚拟机中的显卡驱动是否为：VMware SVGA II
一般情况下，这5点中，满足1、2、3基本可以解决问题，如果全部满足还不行那你只能阿弥陀佛了。当然前提是你已经排除VM OS本身的问题如CPU或内存占用比较大，存储读写延时等等。（注：附件中有图片）
         原创作品，允许转载，转载时请务必以超链接形式标明文章原始出处、作者信息和本声明。否则将追究法律责任。http://saturn.blog./184463/710941
24、用VDR备份无法创建静默快照，因为创建快照操作超过了拖延已冻结虚拟机中 I/O 的时限。
解决方法：停止服务VMware Tools Services,打开Vmware Tools安装程序，选择Modify。不要安装Volume Shadow Copy Services Support，完成后重启VM.

25、如何从本地上传下载文件到ESXi主机
解决方法：1、可以通过ESXi的命令SCP上传和下载，在没有三方工具的情况下这个命令需要需要通过另外一台Linux中转才能把需要的文件上传和下载要需要的文件下。
2、由于Client登陆VC后，可以在上面看到共享的存储空间和本地硬盘，这说明ESXi主机内一定有一个文件同样也可以看到这些空间。经过分析发现/vmfs/volumes/目录就是存储和本地硬盘的存放点。可以通过这个目录上传和下载ESXi主机中的文件。

26、在 vCenter Server 升级到 5.0 版本后，ESX 4.0 Update 2 主机可能崩溃
解决方法：发生崩溃时，同时在紫色屏幕上显示以下消息：NOT_IMPLEMENTED bora/vmkernel/filesystems/visorfs/visorfsObj.c:3391。
解决办法：升级到 vCenter Server 5.0 之前，将由 vCenter Server 管理的所有 ESX 4.0 Update 2 主机升级到 ESX 4.0 Update 3。

27、HA配置到90%时失败，提示：Internal AAM Error-agent could not start
故障状态：
1、第一台主机加入到Cluster没问题，但是第二台主机加入到cluster时，走到90%出错，提示如下错误：Internal AAM Errors-agent could not start
复制代码
2、在aam_config_util_addnode.log文件里有类似如下错误信息：
01.01/23/10 16:20:49 [myexit ] Failure location:
02.01/23/10 16:20:49 [myexit ] function main::myexit called from line 2199
03.01/23/10 16:20:49 [myexit ] function main::start_agent called from line 1168
04.01/23/10 16:20:49 [myexit ] function main::add_aam_node called from line 171
05.01/23/10 16:20:49 [myexit ] VMwareresult=failure
故障分析：
这种故障一般和UDP 8043端口无法访问有一定关系；
解决方案：
确保UDP 8043端口畅通无阻，比如：
执行如下命令：
tcpdump -i vswif0 -s 900 -n udp port 8043 -w ${主机名}.pcap

28、查阅和重装VirtualCenter Server agents(vpxa)服务
故障状态：
·配置VMware High Availability (HA) 失败；
·重新配置 VMware HA时，提示如下错误：
Could not Enable aam firewall ruleset :vim.fault.HostConfigFault
·无法将ESX添加到VirtualCenter；
·尝试重新将ESX添加到VirtualCenter时，提示如下错误：
unable to access the specified host, either it doesn't exist, the server software is not responding, or there is a network problem
·在hostd.log文件中有如下内容：
[2010-05-24 10:45:51.463 'Vmomi' 15752112 info] Throw vim.fault.AlreadyExists
[2008-05-26 10:45:51.463 'Vmomi' 15752112 info] Result:
(vim.fault.AlreadyExists) {
name = "vpxuser"
msg = ""
}
解决方案;
备注：当看到如下错误时，请在ESX主机上重装vpxa：
unable to access the specified host, either it doesn't exist, the server software is not responding, or there is a network problem.
查看安装在ESX/ESXi服务器上的VirtualCenter agent(vpxa)版本号的方法如下：
1.首先确定VirtualCenter的版本号：点击Help按钮，点击About可查阅；
命令查看VMware-vpxa的命令：
rpm -V VMware-vpxa

29、使用IBM服务器可能导致ESXi/ESX 4.1服务器HBA卡和PCI设备停止响应
故障状态：
当使用IBM x3650 M3或BladeCenter HS22V服务器时，可能会在ESXi/ESX 4.1上遇到下面的问题：
1、HBA卡停止响应；
2、某些PCI设备无响应；
3、可以在ALT+F12界面和日志信息里看到这样的信息：
vmkernel: 6:01:34:46.970 cpu0:4120)ALERT: APIC: 1823: APICID 0x00000000 - ESR = 0x40
4、HBA卡停止响应，例如：
   vmkernel: 6:01:42:36.189 cpu15:4274)<6>qla2xxx0000:1a:00.0: qla2x00_abort_isp: **** FAILED ****
   vmkernel: 6:01:47:36.383cpu14:4274)<4>qla2xxx 0000:1a:00.0: Failed mailbox send register test
5、HBA卡可能进入离线状态，例如：
   vmkernel: 6:01:47:36.383 cpu14:4274)<4>qla2xxx 0000:1a:00.0: ISP error recovery failed - board disabled
故障分析：
具体问题还不太清楚，期待VMware官方能够给出解释并放出相关补丁；
解决方案：
在ESXi/ESX 4.1里面雀圣启用了中断重映射代码，而这个代码和部分IBM服务器不兼容，可以通过禁止掉这个代码缺省启动的方式来临时解决这个问题：
1、进入到命令行界面，执行如下命令：
#esxcfg-advcfg -k TRUE ioDisableIR
#init 6
2、重启后检查这个选项是否依然缺省启动：
#esxcfg-info -c
iovDisableIR=TRUE
备注：这就表示缺省没有启动；
也可以利用vSphere Client登录到服务器的GUI进行修改

30、虚拟机无法关闭停止在95%左右的解决办法
一次做虚拟机回收工作，由于目标虚拟机当时杀毒软件正在运行，CPU占用很高，本来想登陆关闭虚拟机，但是远程连接根本没反映，打开VC带的控制台，鼠标点击进去，操作也是在是慢，总归到底，最后，直接将虚拟机电源关闭。之后，就看着任务开始执行，但进度条走到95%的时候，咋都不动了。
解决思路：
这个问题，属于一个“沟通”问题，应该从两方面入手：
1、一个是vCenter端是否已经将此命令顺利传送到ESX；
2、然后是，ESXi/ESX端是否顺利接到命令，以及是否执行了此命令。
解决过程：
1、SSH连接ESX；
2、vmware-cmd <path.vmx> getstate 确定虚拟机状态；
   <path.vmx> 为完全路径（空格等前别忘了加上转义符 /）；vmware-cmd -l命令可查看虚拟机路
3、官方文档说若为On，可继续执行其他命令来结束虚拟机；
但是我走到这里，显示的为Off；这就说明，ESX已经将虚拟机关闭了，那这问题就是一个沟通问题
4、登陆VC，我想先从VC端将此问题虚拟机所在的主机断开连接，之后再重新连接，这样就会进行一次新的对话，但是，由于前一个未关闭虚拟机的任务未执行完毕，之后的任务好像都成队列似的在等待，没有反应。
5、任务无法执行，重启相关VC和ESX服务
VC：在Vitual Center的WIN机器上的，在服务管理器重启VC服务。
ESX：在SSH登陆后对两个服务器执行重启。（注：虚拟机服务会短暂中断）
命令如下：
service mgmt-vmware restart
service vmware-vpxa restart
6、在这沟通中的三个服务都已经重启完毕，此时再执行步骤2时，发现返回的结果为On--那台虚拟机正在运行，发现这个，那么按照官方的文档，后续的几个命令就可以有用武之地了。
7、kill -9 xxxx
ps -auxwww |grep -i <VMNAME>.vmx 可以看到虚拟机的PID
8、执行步骤2，现在已为Off
9、登陆VC查看，刷新下，如果状态还未改变，再重启下VC服务器，即可。
31、为主机应用Host Profiles提示compliance错误

故障状态：

为主机应用Host Profiles失败，提示如下错误：

01.Specification state absent from host: device '<datastore>' state needs to be set to 'on'

02.Host state doesn't match specification: device '<datastore>' needs to be reset

03.Specification state absent from host: device '<datastore>' Path Selection Policy needs to be set to 'VMW_PSP_FIXED'

04.Host state doesn't match specification: device '<datastore>' Path Selection Policy needs to be set to default for claiming SATP

故障分析：

这是由于PSA组件导致的；

解决方案：

1、右击Host Profiles后点击Enable/Disable Profiles配置选项；

2、展开“Storage Configuration”选项，展开“Pluggable Storage Architecture”这个uxanxiang；

3、去掉“PSA Device Configuration”；

4、展开“Native Muti-Pathing(NMP)”这个选项后，接着展开“PSP and SATP configuration for NMP devi”选项；

5、去掉“PSP configuration for”这个选项后点击OK即可。

33、分析、解决IOPS导致的虚拟机/存储性能下降和虚拟机磁盘延时较大的问题

故障状态：

1、虚拟机性能较低；

2、在执行备份时磁盘延时很厉害；

3、虚拟磁盘vmdk延时较大；

故障分析：

这种问题基本都是由于虚拟机没有足够的IO Per Second（IOPS），或者IOPS低于30；

解决方案：

在解决问题前，首先要解决以下两个问题：

问题1：什么是IOPS？

IOPS全称为Input/Output Per Second，它是衡量一个磁盘（虚拟磁盘和物理磁盘）、存储的基本也是十分重要的标准。不同的磁盘、存储有着不同的IOPS。IOPS的高低直接会影响着系统的性能。当前，VMware虚拟化环境中最大的瓶颈也就在于这个IOPS。针对数据密集型业务的数据库业务和流媒体业务，由于它们的IOPS很大，所以在虚拟化环境中部署它们一定要充分考量它们的负载，也就是IOPS大小，结合实际的存储性能来查看是否符合业务标准。

问题2：如何计算IOPS？

如何计算每台虚拟机的IOPS？

要想计算每个虚拟机的总的IOPS数量，首先就要确认磁盘类型以及它们的IOPS是多少。处于RAID阵列里面的每个盘的IO有利于增长整体存储的可用IOPS。而位于这个存储上面的单台虚拟机的IOPS，则可以通过将这个存储的总IOPS除掉虚拟机数量即可基本得到单台虚拟机的IOPS。

现实案例：

假定有6颗10000RPM的磁盘，那么它们的总的可用IOPS大约为150x6=900。如果LUN上面运行的虚拟机数量为50个，则单台虚拟机的IOPS为900/50=18 IOPS。如果以这个为标准，则意味着虚拟机的性能相对底下。如果想要满足虚拟机的基本IOPS需求，那么应该为900/30=30，也就是说同一个Volume里IOPS为30（最低要求）虚拟机需要数量控制在30台以下。

备注：备份存储会消耗更多的IOPS，同时也会给Volume带来更多额外的符合。如果是这样，则需要用额外手段解决备份时的额外资源消耗（可以通过I/O meter软件来测试IOPS）

34、丢失或锁定文档导致虚拟机无法Power On

故障状态：

1、虚拟机无法开启；

2、尝试开启虚拟机时，看到类似如下错误信息：

•Unable to open Swap File；

•Unable to access a file since it is locked；

•Unable to access Virtual machine configuration；

3、在/var/log/vmkernel文件里可以看到类似如下信息：

WARNING: World: VM xxxx: xxx: Failed to open swap file <path>ock was not free

WARNING: World: VM xxxx: xxx: Failed to initialize swap file <path>

4、当尝试开启虚拟机的console控制台时，可能会收到如下错误信息：

Error connecting to <path><virtual machine>.vmx because the VMX is not started

5、在开启虚拟机时，卡在95%位置无响应；

6、从模板部署一台新的VM之后无法开启虚拟机；

7、虚拟机在vCenter Server和ESXi/ESX主机之间报告控制台电源状态冲突；

故障分析：

导致这个问题的因素可能很多，但是众多问题中，都穿插或包含着文件损坏或文件被锁定等问题的可能。虚拟机常用的文件包括：

•*.vswp

•*-flat.vmdk

•*-delta.vmdk

•*.vmx

•*.log

解决方案：

首先需要确认哪些文件处于锁定状态：

1、利用vSphere Client登录ESXi/ESX主机、vCenter Server主机；

2、在Datastore里找到想要开启但是无法开启的虚拟机所在位置；

3、尝试开启虚拟机，如果无法开启且console显示错误，先查阅vmware.log日志文件的相关信息来确认问题；

4、利用SSH或COS选用root权限登录到ESXi/ESX主机之后执行下面的命令查看虚拟机的完整路径：

#vmware-cmd -l

系统将输出类似如下信息来显示注册到ESXi/ESX主机的虚拟机：

/vmfs/volumes/<UUID>/<虚拟机目录>/<虚拟机名>.vmx

5、执行下列命令切入到这个虚拟机所在的目录：

#cd /vmfs/voluems/<UUID>/<虚拟机目录>

6、然后查阅vmware.log日志，在文件的尾部查看什么原因导致这个问题后再针对性的分析。

准确定位并删除掉锁定文件

由于虚拟机可以在主机之间移动，如果虚拟机注册到的主机保持对文件的锁定状态，那么，这个锁定文件可以有效保障ESXi/ESX主机对虚拟机文件的控制权和有效保护虚拟系统。主机由Service Console接口的MAC来确定。lock由VMkernel或Service Console负责维护；

备注：ESXi服务器没有Service Console所以，lock由VMkernel单独负责维护；

首先要确定VMkernel可能锁定的文件：

1、执行下面的命令来报告锁定目录所在的MAC地址：

#vmkfstools -D /vmfs/volumes/<UUID>/<虚拟机目录>/<锁定状态文件>

2、由于负责锁定.vmdk文件的主机会将MAC地址写入到vmkernel日志里面，那么可以用下面的命令查阅：

#tail /var/log/vmkernel

35、Storage vMotion失败：looking for lines staring with "CBTMotion"

故障状态：

1、执行Storage vMotion失败；

2、系统提示如下错误信息：

01.A general system error occurred: Storage VMotion failed to copy one or more of the VM's disks. Please consult the VM's log for more details, looking for lines starting with "CBTMotion-".

复制代码3、/var/log/vmware/hostd.log文件里有类似如下信息：

01.Failed with error 340983807: Storage VMotion failed to copy one or more of the VM's disks. Please consult the VM's log for more details, looking for lines starting with "CBTMotion".

复制代码故障分析

可能由于虚拟机的硬件版本号过老导致；

解决方案：

关掉虚拟机后右击uxniji选择Upgrade Virtual Machine Hardware即可。

36、添加LUN时提示HostDatastoreSystem.QueryVmfsDatastoreCreateOptions

故障状态：

系统能够扫描到Devices LUN，但是在添加过程中却提示如下错误信息：HostDatastoreSystem.QueryVmfsDatastoreCreateOptions ，如图所示：

故障分析：

这样的问题一般都是由于LUN的尺寸过大导致，一般来说，VMware ESXi/ESX Server标准支持最大的LUN尺寸为2TB-512Byte，但是由于国内很多技术人员对这个-512Byte并不太在意，所以习惯型的讲成2TB，这就导致很多用户在使用时，直接分配了2TB的空间，这就可能导致了上述问题；

解决方案：

针对这样的问题，建议如下：

1、如果已经分好了2TB的LUN，建议调整为1.88TB左右后再尝试添加；

2、新LUN规划用户则请严格参照官方文档的参数设计，建议是1.88TB左右为一个LUN生成Datastore

37、vCenter Converter推送Agent出错：Converter Agent installer/uninstaller Failed

故障状态：

1、利用vCenter Converter推送Agent到Windows Server 2003服务器上时，失败；

2、系统提示类是如下错误信息：

01.Converter Agent installer/uninstaller failed on 'xxxxxxxxx'.

3、VMware vCenter Converter的日志文件converter-server.log里面有类似如下错误提示：

01.[#6] [2011-01-21 10:50:55.976 04080 info 'App'] [agentManager,83] [AgentManager] Install Agent on 192.168.10.10

02.[#6] [2011-01-21 10:51:16.976 04080 error 'App'] [agentManager,95] [AgentManager] Install Agent failed: converter.fault.AgentDeploymentFault

03.[#7] [2011-01-21 11:18:37.289 03976 info 'App'] Reusing existing VIM connection to 192.168.30.150

04.[#7] [2011-01-21 11:18:37.476 03976 error 'App'] Found dangling SSL error: [0] error:00000001:lib(0):func(0):reason(1)

05.[#7] [2011-01-21 11:19:00.945 02756 info 'App'] [agentManager,83] [AgentManager] Install Agent on 192.168.10.10

06.[#7] [2011-01-21 11:19:21.961 02756 error 'App'] [agentManager,95] [AgentManager] Install Agent failed: converter.fault.AgentDeploymentFault

7.[#7] [2011-01-21 11:19:32.445 03976 info 'App'] [diagnosticManager,357] Generating Converter.Server log bundle.

故障分析：

以下几种情况可能导致这样的问题：

1、445端口没能打开；

2、曾经手动安装过Agent后卸载；

3、Windows服务管理其中的server服务没有启动导致的IPC$连接失败；

4、防火墙阻绝；

解决方案

1、确认445端口或NetBIOS协议能正常使用；

2、建议在Converter时关闭防火墙；

3、如果依然有问题，尝试用Converter Standardalone版本迁移或采用ConverterCD进行冷克隆。

38、解决在vSphere 5.0里开启HA时，提示：Datastore Heartbeating不足的问题

故障状态：

为ESXi 5.0+vCenter 5.0配置HA时，提示如下信息：

故障分析：

这是由于vSphere 5.0里的HA部分已经重写，并且新增了Datastore Heartbeating用于网络Partition心跳检测支持；

解决方案：

有2个选择，一个是加多存储用于心跳检测，这也是正确的选择，就不多讲，另一个就是忽略掉这个问题，方法如下：

1、vSphere Client登录到vCenter Server 5.0后，右击HA Cluster，点击Edit，然后找到高级选项设定：

2、再如上图所示的内容中，添加下参数：

das.ignoreinsufficienthbdatastore

备注：缺省情况下，这个参数的值是false的。

39、通过vSphere Client登陆ESXi主机提示“正在更新”的问题

故障状态：

通过vSphere Client登陆VCenter Server4.1正常，登陆ESXi主机提示如下图：

故障分析：

需要通过‘vSphereclient.vmware.com’来更新Client说明客户端存在问题，由于登陆VCenter Server4.1不存在任何问题，所以基本确定版本的问题。查看ESXi版本和vSphere Client，发现Client的版本低于ESXi版本。

解决方案：

由于Client所在网络无法上Internet,所以无法更新Client客户端，可以通过安装高版本的Client来解决此问题。

40、红旗32位Linux进入系统时提示”udevu”无法继续进入系统的问题

故障状态：进入系统后，出现下图的界面，之后无法向下运行，必须按Ctrl+C才能继续向下运行

故障分析：由于系统安装时候是完整的，光盘镜像包是完整的，安装的时候不存在任何问题。考虑到物理机上不存在这种问题，怀疑虚拟机虚拟驱动的问题，安装新的VMware-tools问题依旧。

解决方案：考虑到红旗Linux比较新，去官方下载11月份最新的VMware-tools，问题解决 (下载地址：http://packages.vmware.com/tools/esx)

60、在view桌面中，Win7下安装出现软件出现“系统管理员设置了系统策略，禁止进行此安装”的提示解决方案：
1、打开“开始->控制面板->管理工具->本地安全策略”->点击“软件限制策略”，如果提示“没有定义软件限制策略”，那么就右键“创建软件限制策略”->创建后，双击右侧“强制”，选择“除本地管理员以外的所有用户”，确定
2、windows开始菜单，运行里面输入gpedit.msc打开组策略,
在“计算机配置”→管理模板→windows组件→windows installer，右边第一项就是禁用windows installer。把它改成 “未配置”后者“已禁用”就可以了。
3、删除HKEY_CLASSES_ROOT\Installer\Products\4080110900063D11C8EF10054038389C注册表项目。（建议使用此法，能解决大多数你出现的情况，在运行栏里输入regedit进入注册表，按照以上路径找到项目删除就可以了）

61、持续较高的 CPU 使用情况的解决方案故障状态:
CPU 使用情况中的临时高峰表示 CPU 资源的使用情况最佳。持续较高的 CPU 使用情况可能表示存在问题。
您可以使用 vSphere Client CPU 性能图表监控主机、群集、资源池、虚拟机和 vApp 的 CPU 使用情况。
问题
n 主机 CPU 使用情况一直很高。 CPU 使用情况值较高时会增加主机上虚拟机的就绪时间和处理器列队。
n 虚拟机 CPU 使用情况超过 90% ，且 CPU 就绪值超过 20% 。应用程序性能将受到影响。
原因
主机可能缺少满足要求所需的 CPU 资源。
解决方案：
n 验证是否在主机的每台虚拟机上均安装了 VMware Tools 。
n 将主机上或资源池中其他虚拟机的 CPU 使用情况与此虚拟机的 CPU 使用情况值进行比较。主机的虚拟机
视图上的堆栈条形图显示主机上所有虚拟机的 CPU 使用情况。
n 确定虚拟机就绪时间过长是否由其 CPU 使用情况时间达到 CPU 限制设置所致。如果出现这种情况，请增
加虚拟机上的 CPU 限制。
n 增加 CPU 份额以给予虚拟机更多机会运行。如果主机系统受到 CPU 约束，则主机上的总就绪时间可能仍
维持在相同级别。如果主机就绪时间没有减少，则为高优先级虚拟机设置 CPU 预留，保证它们收到所需
要的 CPU 周期。
n 增加分配给虚拟机的内存量。此操作会减少所缓存应用程序的磁盘和 / 或网络活动。这可能会降低磁盘
I/O ，并减少主机对虚拟化硬件的需求。具有较少资源分配的虚拟机通常可累积更多的 CPU 就绪时间。
n 将虚拟机上的虚拟 CPU 数量减少到执行工作负载所需要的数量。例如，四路虚拟机上的单线程应用程序
只能从单个 vCPU 中受益。而管理程序还需维护三个空闲 vCPU ，占用本可用来处理其他工作的 CPU 周期。
n 如果主机不在 DRS 群集中，则将它添加到一个群集中。如果主机在 DRS 群集中，则增加主机数，并将一
个或多个虚拟机迁移到新主机上。
n 如有必要，请在主机上升级物理 CPU 或内核。
n 使用最新版本的管理程序软件并启用 CPU 节省功能（例如 TCP 分段卸载、较大内存页面和巨型帧）。

63、vMotion虚拟机失败：A general system error occurred:Failed to flush checkpoint故障状态:
1、尝试vMotion一台虚拟机失败，提示如下错误信息：
A general system error occurred:Failed to flush checkpointt data!
2、此时故障虚拟机的设定如下：
•分辨率大于 1280x1024或小于第二个屏幕的分辨率；
•显卡驱动选用了WDDM；
•虚拟机的硬件版本号为8；
3、vCenter的Task & Events里的详细错误描述如下：
•An I/O error occurred while saving the checkpont:0(Resource temporarily unavailable)；
•Failed to write checkpoint data(offset xxxxxxxx,size xxxxx):Failed to resum VM；
4、在虚拟机的vmware.log日志文件里有类似如下信息：
.vmx| MigrateSetState: Transitioning from state 9 to 11.
.vmx| Migrate_SetFailure: Failed waiting for data.  Error bad0006. Limit exceeded.

.vmx|
.vmx| Migrate: cleaning up migration state.
.vmx| MigrateSetState: Transitioning from state 11 to 0.
.vmx| Msg_Post: Error
.vmx| [vob.vmotion.chkpt.toobig] vMotion migration [XXXXXXXX:xxxxxxxxxxxxxxxx] failed. The checkpoint data length (xxxxx bytes) or the offset (xxxxxxxx bytes) exceeds the maximum checkpoint data length (xxxxxxxx byte).
.vmx| [msg.moduletable.powerOnFailed] Module Migrate power on failed.
故障分析:
这种情况可能是由于虚拟机的硬件版本号为8，WDDM驱动以及虚拟机的显存等问题导致；
解决方案:
由于问题可能不是由于单一原因导致，因此，可根据如下方式分别进行故障排查处理：
1、将屏幕的分辨率调整一下，小于1280x1024或和第二块屏幕的分辨率相等；
2、不要将虚拟机的硬件版本号升级为8；
3、增加checkpoint cache size，将它从8MB升级到16MB，方法如下：
•关闭虚拟机后右击虚拟机点击Edit Settings；
•在弹出的对话框中找到Options页标签后选择Advanced选项，在General下选择Configuration Parameters；
•点击Add Row后输入如下参数：migrate.baseCptCacheSize值设定为后点击Ok应用更改；
4、将mks.enable3d的值设定为TRUE，步骤如下：
•关闭虚拟机后右击虚拟机点击Edit Settings；
•在弹出的对话框中找到Options页标签后选择Advanced选项，在General下选择 Configuration Parameters；
•点击Add Row后输入，将值设定为True后点击Ok保存关闭。

64、迁移完成vCenter Server数据库到新主机后，VirtualCenter Management WebServices不对故障状态:
1、vCenter Server数据库迁移到一个拥有新主机名和IP地址的系统上时，VirtualCenter Management WebServices服务异常；
2、vSphere Client登录服务器时，看到Performance Overview Charts报错如下：
General report generation exception
Perf Charts service experienced an internal error.
Message: Report application initialization is not completed successfully. Retry in 60 seconds.
3、vSphere Client登录到vCenter Server后搜索之类的功能都无法使用；
4、vCenter Service Status显示VirtualCenter WebServices和很多其它服务都处于离线状态，  报如下错误信息：
Unable to retrieve health data from https://localhost:8443
Service initialization failed.
故障分析:
当vCenter Server的数据库被迁移到新位置后，必须要更改DSN的信息，然而，Tomcat Server的设定却不会随之变化，因此，我们需要对Tomcat Server进行修改之后才能正常，Tomcat Server被用于支持VirtualCenter Management Webservices服务运行；
解决方案:
解决方案就是进入到Tomcat Server的配置文件里，找到database_name.propeties，通常位置如下：
•W2K3 - C:\Documents and Users\All Users\Application Data\VMware\VMware VirtualCenter\
•W2K8 - C:\ProgramData\VMware\VMware VirtualCenter\
修改Tomcat Server的数据库位置方法如下：
1、文本文件打开database_name.properties，找到如下内容：
url=jdbc:sqlserver:/DB_hostname\\DB_instance;databaseName\=database_name;integratedSecurity\=true
2、修改上述文档中对应位置的数据库的对应主机名或IP地址；
3、重启VMware VirtualCenter Management Webservices服务或重启vCenter Server服务器后，理论上即可恢复正常。

65、在ESXi 5.0里，无法将管理网路迁移到vDS 故障状态：
1、无法将管理网路迁移到ESXi 5.0所在的vDS上，提示如下错误信息：
  A specified parameter was not correct
2、vCenter Server上有类似如下的错误消息：
  Call "HostNetworkSystem.UpdateNetworkConfig" for object "networkSystem-121" on vCenter Server "vCenter in vmanager.local" failed.

a13698822086 · 发表于 2013-3-13 16:51:24

帮帮顶顶！！

上都海奶茶馆 · 发表于 2013-5-16 01:36:42

昨天，系花对我笑了一下，乐得我晚上直数羊，一只羊，两只羊，三只羊……

123sw · 发表于 2013-5-18 19:25:12

长得真有创意，活得真有勇气!

ykwll · 发表于 2013-5-21 10:03:54

丑，但是丑的特别，也就是特别的丑！

fswdnr · 发表于 2013-5-24 10:30:41

走，MM，咱们化蝶去……

buser · 发表于 2013-5-29 09:48:14

我本非随便的人，但如果你想随便，那我就随你的便好啦！

账号		自动登录	找回密码
密码			立即注册

VMware vcenter+vSphere 6.5 U2共享

【跟谁学】韩宇极简英语课-技术人员不得不

用Zabbix通过JMX方式监控weblogic

winhex数据恢复教程（非常巨大，内容丰富）

Symantec Backup Exec 2015 2016/2012 BE20

NetScaler VPX部署之：NetScaler Gateway调

zabbix3.4.1安装部署+微信推送信息+大屏显

[经验分享] Vmware vSphere常见问题汇总

相关帖子

扫码加入运维网微信交流群