OpenStack 部署及运维中遇到的问题汇总 memo

来源:互联网 发布:java中常量的写法 编辑:程序博客网 时间:2024/05/17 02:34
2013/08/06  添加1-5。
2013/08/12  添加6-7。
2013/08/27  添加8。
2013/09/05  添加9。
2013/09/12  修改5,添加10。
2013/10/16  添加11。
2013/10/24  添加12。
2013/10/25  添加13。
----------------------------------------------------------------------------------------------------------------------------

1. 使用RabbitMQ-Server的HA时,2.61版本有内存泄漏问题,需要使用2.7.1或以上版本,推荐2.8.1。

2. Horizon的debug需要关掉,否则httpd的日志会非常巨大(很快增长至几百GB)


3. nova-consoleauth部署在多节点时,需要使用memcached作为其后台存储,否则会有问题。

4. 使用Cisco harden image时, 有部分系统命令权限被改为了550, 需要改为555,否则libguestfs会出错(会以other身份使用这些系统命令)。

5. compute节点的var目录需要比较大的disk空间。


6. keystone token 过期后在数据库中永远不会真实删除,会导致表过大,需要周期性删除过期数据。

7. glance作HA时,nova.conf中需要配置glance_host为HA的地址。

8. 在horizon中没有volume的snapshot的quato,报了个bug: https://bugs.launchpad.net/horizon/+bug/1217218
不过,API和CLI支持修改:
cinder quota-show XXX
cinder quota-update --snapshots 50 XXX

9.  使用类似以下环境部署时,发现G版本的glanceclient还存在SSL的bug。nova调用glancecilent时会有问题:
https://bugs.launchpad.net/python-glanceclient/+bug/1157864
 glanceclient需要升级到0.10.0版本:


10.  典型部署:


11. nova-network在multi部署的时候每台compute节点的dnsmasq都作为dns server的功能。在G版本的quantum中情况有些不同,quantum不能dhcp-agent启动的dnsmasq并不带有dns server功能,需要使用外部dns server。另外在G版中nova无法将instance name告知quantum, 因此hostname为"IP",这会造成实际hostname(由quantum管理)和metadata中获取的hostname(由nova管理)不一致的问题。在H版中有解决这个问题的BP。拭目以待。

12. 使用nova-network多节点部署时,floating ip只能是属于一个vlan的,不能支持不同vlan的情况。

13.

We find our VM boot at first time isreally very slow. When we boot a VM with 1.4GB image , we need about 5 mins.

The resean is nova need to download theimage through Glance. And store the image into /var/lib/nova/instance/_base .

The transmit of the image cost about 5 mins.And I find when we use swift download the image on the compute, we just needabout 0.5mins.

And if we download the image through glancewe need 5 mins.


Swift download data flow: (performance isGood)

Client(On compute1)  à HA(8080)  à  Swift proxy(8080) à Swift Storage

# date; swift download glance8966460a-9dba-4a56-b208-a20b29f8d6f4 ; date

Tue Oct 29 08:20:36 GMT 2013

8966460a-9dba-4a56-b208-a20b29f8d6f4[headers 0.286s, total 28.637s, 50.915s MB/s]

Tue Oct 29 08:21:05 GMT 2013

 

Glance download data flow: (performance isBad)

Client(On compute1)  à HA(9292)  à  Glance api(9292)  à HA (8080) à Swiftproxy(8080) à Swift Storage

# date; glance image-download8966460a-9dba-4a56-b208-a20b29f8d6f4 > test.img ; date

Tue Oct 29 08:04:56 GMT 2013

Tue Oct 29 08:10:00 GMT 2013

 

This means the swift is not the bottleneckwhile download the image.

 

We find that if client communite withglance without haproxy, the performance will be good.

Client(On compute1)  à  Glanceapi(9292)  à HA (8080) à Swift proxy(8080) à Swift Storage

# date; glance image-download8966460a-9dba-4a56-b208-a20b29f8d6f4 > test.img ; date

Thu Oct 31 06:52:56 GMT 2013

Thu Oct 31 06:53:17 GMT 2013


--------------------------------------------
To Be Continued...


原创粉丝点击