centos7安装cuda-8.0报错modprobe: FATAL: Module nvidia-uvm not found.
来源:互联网 发布:数据库的安全性控制 编辑:程序博客网 时间:2024/05/29 08:23
centos7上cuda-8.0驱动安装失败的解决方案
曾几何时,在centos7机器上插NVIDIA Titan X的卡,按官网教程(https://developer.nvidia.com/cuda-downloads)一键安装cuda-8.0一切顺利
Installation Instructions:- `sudo rpm -i cuda-repo-rhel7-8-0-local-8.0.44-1.x86_64.rpm`
- `sudo yum clean all`
- `sudo yum install cuda`
不久前,在另一台centos7按上述步骤安装cuda,愕然发现机器没插GPU,怠。
今天,该机器插了4块Titan X,重装cuda,未果。循环卸了重装,未果。
# yum install cuda 不报错,cuda-install-samples.sh什么的都没问题,真正调gpu的时候就挂
$ /usr/local/cuda/extras/demo_suite/deviceQuery
modprobe: FATAL: Module nvidia-uvm not found.
$ ls /proc/driver|grep nvdia
$ modinfo nvdia
modinfo: ERROR: Module nvidia not found.
要知道,正常情况下, modinfo nvdia的输出应该类似这样
filename: /lib/modules/3.10.0-327.36.2.el7.x86_64/extra/nvidia.ko
alias: char-major-195-*
version: 367.48
supported: external
license: NVIDIA
按照官网教程开始debug...
1.1 查看显卡状态
$ lspci | grep -i nvidia 可见4块显卡,正常
1.2 检测安装包无误
$ md5sum cuda-repo-rhel7-8-0-local-8.0.44-1.x86_64-rpm
24fea3b7f2e5f7e3f155cd73bc008108 cuda-repo-rhel7-8-0-local-8.0.44-1.x86_64-rpm
与官网的checksum(http://developer.download.nvidia.com/compute/cuda/8.0/Prod/docs/sidebar/md5sum.txt)对比,无误。
1.3 检查系统依赖
$ yum info dkms
$ yum info libvdpau
$ yum info kernel-devel
1.4 为内核安装nvdia模块
dkms的模块需要经过added, build, install 3个步骤才能被modinfo检测到
$ dkms status
nvidia, 367.48: added
显然,nvidia模块在安装的时候只是被added,还没有生成installed模块,原因不详。
# dkms build -m nvdia -v 367.48
会报kernel headers not found的错误,大概就是找不到/lib/modules/3.10.0-327.el7.x86_64/build/include
如果我们
$ cd /var/lib/dkms/nvidia/367.48/source/
$ make
会报/lib/modules/3.10.0-327.el7.x86_64/build: 没有那个文件或目录的错误
解决的话加个链接就好了,如果 /lib/modules/3.10.0-327.el7.x86_64/build是个存在的文件就删掉
$ ln -s /usr/src/kernels/3.10.0-327.36.3.el7.x86_64/ /lib/modules/3.10.0-327.el7.x86_64/build
# dkms build -m nvdia -v 367.48
# dkms install -m nvdia -v 367.48
可能需要重启
$ modinfo nvdia
$ modinfo nvdia-uvm
问题解决~
吐槽一下官网的CUDA QUICK START GUIDE和NVIDIA CUDA GETTING STARTED GUIDEFOR LINUX
过气太久,误导价值大于参考价值(好吧。。还是有参考价值的)
cuda-8.0没有/usr/bin/nvidia-uninstall
/dev下没有叫nvdia的很正常
参考链接
http://www.cnblogs.com/wwang/archive/2011/06/21/2085571.html
http://blog.csdn.net/qq_21111579/article/details/49337191
- centos7安装cuda-8.0报错modprobe: FATAL: Module nvidia-uvm not found.
- modprobe: FATAL: Module nvidia-uvm not found 解决方法
- 【Linux】【Docker】CentOS6.9主机上Docker Ubuntu14.04系统安装CUDA问题Module nvidia-uvm not found
- modprobe:FATAL:module "xxx" not found
- modprobe FATAL: Module cmemk not found. 解决方案
- modprobe drdb FATAL: Module drdb not found
- modprobe: FATAL: Module xxx.ko not found in directory /lib/modules/$(uname -r)
- FATAL: Module pmouse not found.
- modprobe: module '/lib/modules/4.9.13/tun.ko' not found
- 关于FATAL: Module ndiswrapper not found
- FATAL: Module iptable_nat not found解决办法
- "FATAL: Module scsi_wait_scan not found" 解决方法
- Pycharm添加包后运行报错module not found
- linux下modprobe: module ath.ko not found in modules.dep
- docker使用cuda gpu的时候缺少nvidia-uvm
- Ubuntu安装CUDA报错:/usr/lib/nvidia-375/libEGL.so.1 不是符号连接
- 在CentOS7上安装NVIDIA CUDA 并在docker中使用CUDA
- Windows平台的 PHP 报错 Fatal error: Class COM not found in 的解决方法
- poj1269——Intersecting Lines(判断线段交点)
- CSS3你可能不知道的冷知识
- poj2299 Ultra-QuickSort(归并排序 || 离散化+树状数组)
- ZCMU—1678
- Fence Repair
- centos7安装cuda-8.0报错modprobe: FATAL: Module nvidia-uvm not found.
- ZOJ :: GCD Reduce
- Redis配置文件详解(redis.conf)
- 跟我一起写makefile—陈皓
- notepad++ plugin 编写步骤
- Depends工具(检查exe文件依赖的好朋友)
- Pwn学习历程(1)--基本工具、交互、调试
- Go线程测试
- java中clone方法的作用