vmware启动xorg失败排错!K1 K2卡

来源:互联网 发布:动态主题软件 编辑:程序博客网 时间:2024/04/30 11:37
我要啦免费统计

近期做基于3D的远程桌面系统部署,主要测试citrix desktop和vmware vSGA方案。

经测试,vmware在3D远程桌面确实差远了。


vmware安装时总是无法启动xorg服务。经大量测试,大量翻墙,最终确认:


vmware做vSGA方案时仅能使用1块K1卡。如果需要使用多个K1卡,请更换为Citrix方案!


xorg排错具体如下:


10.1.1.1 确认是否已安装 NVIDIA VIB 捆绑包
# esxcli software vib list | grep NVIDIA
如果已正确安装 VIB,则输出结果应当与下面的示例相似:
NVIDIA-VMware 304.59-1-OEM.510.0.0.799733 NVIDIA VMwareAccepted 2012-11-14
10.1.1.2 确认 NVIDIA 驱动程序是否已加载
# esxcli system module load –m nvidia
如果驱动程序已正确加载,则输出结果应当与下面的示例相似:
Unable to load module /usr/lib/vmware/vmkmod/nvidia:Busy
如果 Nvidia 驱动程序没有加载,请检查 vmkernel.log:
# vi /var/log/vmkernal.log
搜索“NVRM”。
一般来说,如果 GPU 有问题,vmkernal.log 中会指出
10.1.1.3 确认主机中是否存在显示设备
# esxcli hardware pci list –c 0x0300 –m 0xff
输出结果应当与下面的示例相似:
000:001:00.0
Address:000:001:00.0
Segment:0x0000
Bus:0x01
Slot:0x00
Function:0x00
VMkernel Name:
Vendor Name:NVIDIA Corporation
Device Name:NVIDIAQuadro 6000
Configured Owner:Unknown
Current Owner:VMkernel
Vendor ID:0x10de
Device ID:0x0df8
SubVendor ID:0x103c
SubDevice ID:0x0835
Device Class:0x0300
Device Class Name:VGA compatible controller
Programming Interface:0x00
Revision ID:0xa1
Interrupt Line:0x0b
IRQ:11
Interrupt Vector:0x78
PCI Pin:0x69
Spawned Bus:0x00
Flags:0x0201
Module ID:71
Module Name:nvidia

Chassis:0
Physical Slot:1
Slot Description:
Passthru Capable:true
Parent Device:PCI 0:0:1:0
Dependent Device:PCI 0:0:1:0
Reset Method:Bridge reset
FPT Sharable:true

注意::::::

该步骤如果出现Module Name: None状况,xorg服务是无法启动的!!!

由于vmware在设计该方案时采用的是Q5000和Q6000的卡,非K系列卡,故未发现该问题!!而在虚拟化环境中,大量采用K1或K2的卡,安装时均会卡在本步骤!


解决方法如下:

在BIOS设置中关闭"64 bit PCI ressource"选项(在部分型号主板中为above 4G)。保存BIOS配置重启后故障修复,xorg顺利启动!!!


故障分析:

K1的架构为4块Q5000,显存达到奇迹般的16G。PCI-E 3.0标准较传统的2.0支持更大的带宽,采用更高的编码,支持到更快速的设备,在默认情况下,所有设备均需要使用64位的PCI ressource。而vmware方案需要单独的nvidia驱动,该驱动据说开发时缺少nvidia相关人员的参与,因此性能发挥很差,不支持64位PCI ressource。


关闭64 bit PCI ressource后单张K1卡可以正常工作。


但多张K1(2张或以上)卡工作时,由于PCI-E设备自身内存的和超过了PCI-E 3.0总线默认情况下的32G(数据推测),故必须要开启64 bit PCI ressource。

而开启64 bit PCI ressource后vmware的xorg又无法启动。


郁闷纠结中,垃圾vmware。。。。。



10.1.1.4 可能会发生的 PCI 总线插槽顺序问题
如果您需要在服务器中安装另一个低端 GPU,则 PCIe 插槽中的显卡的顺序可能会导致为 ESXi 控制台会话选择高端显卡。如果发生这种情况,您只需交换两个 GPU 使用的 PCIe 插槽,或者在服务器 BIOS 中更改“Primary GPU”(主要 GPU)设置即可解决问题。
10.1.1.5 检查 Xorg 日志
如果存在正确设备,则查看 xorg 日志文件可能会有帮助,可以看到是否存在任何明显问题。
# vi /var/log/Xorg.log
10.2 sched.mem.min 错误
如果您收到关于 sched.mem.min 的 vSphere 错误,请在虚拟机的 .vmx 文件中添加以下参数。
sched.mem.min = “4098”
注意: “4098”需要与配置的虚拟机内存量一致。上例适用于具有 4 GB RAM 的虚拟机。




原创粉丝点击