1 计算节点起不来的一般问题
两个网卡ping的通吗 配置文件设置正确吗 看日志 看一下nova-manage service list
2 Permission denied: '/var/lib/nova/instances/_base/eae678cf9d2afbfe78a6b0e11ee1d1b1229ba6f1.part' 想把一个分区挂载到/var/lib/nova/instances/_base下。先创建_base,然后挂载,然后创建实例,但是创建不了,其实是_base的权限问题。chown nova _base这条命令解决。
3 用fdisk 新建的分区,想要挂载在文件夹下,各种有问题,比较对的步骤应该是new完之后reboot一下,然后mkfs -t ext4 /dev/sda4 这样格式化,然后再mount。
4 Unable to complete operation on network fee014ad-1700-4de4-8e7d-2e38ea415877. There are one or more ports still in use on the network. 只要quantum floatingip-list 一个个删了就行。
5 nova-compute 起不来,查看日志发现ERROR nova.compute.manager [req-2b1a2df4-bd90-4e24-9b02-bb194879b254 None None] Instance e9710b21-ba10-4ba7-8208-2236f42b1efb found in the hypervisor, but not in the database 这个时候要用kvm命令来删除这些实例 具体可以参考这个帖子http://blog.csdn.net/sahusoft/article/details/4512992 使用的命令是virsh list --all 和 virsh destroy 如果destroy不行的话 就用undefine
6 虚拟路由的interface处于down的状态
7 Setting instance to ERROR state. 配置文件问题 在multihost的时候遇到这个问题 我在nova.conf里面加了这句 scheduler_default_filters=AllHostsFilter
8 Instance failed to spawn
9 ERROR nova.openstack.common.rpc.common [req-f5c4217e-673d-46d3-9511-dbc1462b4bc8 None None] AMQP server on localhost:5672 is unreachable: Socket closed. Trying again in 1 seconds. 同时 nova-manage service list 全部是XXX
10 一大早过来nova-compute怎么都起不来啊 就算是换了全新的nova.conf也不行啊 尼玛原来是配置文件的权限问题 我直接弄个配置文件把他给替换了
11 很多时候 服务重启下就好了
12 vm能ping通虚拟路由的wan口 但是ping不通外网 发现interfaces文件里面的br-ex 的网关居然是错的 擦~
13 [Errno 111] Connection refused 这事是keystone的问题 响应模块的授权地址有问题
13 如果nova-compute本来是可以启动的 但是重启机子之后老是启动不了 没事 多试几次 过一会就能启动了
14 实现了multihost的方案,之前已经不能解决的网络问题放在另外一个网络环境里面一下子就解决了 应该考虑到的可能是之前这边的网络环境太差了,也有可能是openvswitch的问题,存在两个br-int和br-ex冲突了?? 有可能 openvswitch的东西真的还不是很懂的赶脚~
15 强制删掉ext网络的一个port之类的删不掉 是因为要先把floating ip 删掉
16 昨儿个出现了qrouter ns删不掉的问题 如果配置文件没错 那么重启下节点就好 如果配置文件有问题 应该是在root_helper这个参数上出问题
17 像nova-compute这种东西 启动不了 就重启多几次 就行了~
18 Instance 8ad63da4-5967-4ccb-9cd9-e3e94817cfd4 found in the hypervisor, but not in the database 类似的 用virsh list看看结算节点上有没有没删掉的vm 有的话 destroy掉 没有的话 在dashboard上删掉这个几点上的vm 再重启nova-compute
19 如果像9.9.0.OOXX 连9.9.0.1都ping不通 考虑可能是br-int的问题 输入命令ifconfig br-int up 进行修复
20 add bridge failed: No such process 报了这个错 ovs重装就好了 重装需要remove --purge 还有autoremove 还有需要重装ovs-agent 还可能需要rmmod brconpat
或者直接rmmod brconpat 还有把/etc/module 里面的brconpat 去掉
21 安全组策略在一台计算节点上能用 在另外一台计算节点上不能用的原因是 openvswitch里面的一个模块 叫做openvswitch-brcompat的 是要将它rmmod brcompat就可以了 这块东西主要是会跟linux自带的防火墙冲突
22 ERROR: The resource could not be found. 在建vm的时候如果这样的话 ,肯定是各种选错了,如果都不是那么就是环境变量的租户有问题。
23 在同个交换机里面转移控制节点,发现vnc起不来,检查nova.conf没有问题,后来发现是原来的控制节点只改了ip没改网段,结果组件的消息全部发到新的控制节点上来了,解决办法是把原来的控制节点的的ip改网段,同时重启控制节点的rabbitmq服务器,然后重启两个计算节点的nova-compute服务。
24 如果网址网关都设置没错但是还是路由不出去的话 试试这一句 route add default gw 172.18.215.254 dev eth0
25 Unable to retrieve quota information 这一类的错误 无外乎是nova api配置文件错误 keystone数据错误 quantum 或者nova的数据库有问题 也可能quantum需要重启
26Failed to create OVS patch port. Cannot have tunneling enabled on this agent, since this version of OVS does not support tunnels or patch ports. Agent terminated!
27 AgentNotFoundByTypeHost 各种丧心病狂的错误 反正包括上面那个错误的话 都是ovs的问题 求其原因是我有一个计算节点装了12.04.3 的 内核3.8.0-29-generic 抬高了
28 如果出现Getting disk size of instance-OOXX : [Errno 2] 那么看看virsh list --all 然后virsh destroy 然后 virsh undefine 这些 如果还有一些没删除 那么用这个命令 还有virsh undefine $domain --managed-save
29 vnc的问题 查看日志是在 /var/log/upstart 里面找 叫做 nova-novnc...
30 ERROR: Invalid OpenStack Nova credentials. 肯定是novarc文件的问题 好好检查
31 ERROR: Unauthorized (HTTP 401) keystone 创建脚本问题
32 发现在一个节点上的vm有分配ip 另外一个节点上的没有 各种没报错 结论就是 数据网段不同 GRE通道没有建立
33 can't add qvb4cd94d7b-2d to bridge qbr4cd94d7b-2d 导致nova-compute 要不你找出那个vm删了 不然就全部vm删了 重启novacompute
34 ERROR: The server has either erred or is incapable of performing the requested operation. 不知道为什么 /var/lib/nova/instances爆满 删掉一个之后重启就好了
35 关于nova的instance里面出什么问题 几个思路 1 virsh list 2 /var/lib/nova/instances/里面的东西 3 清空nova数据库 重建一下