Ubuntu 16.04 + Nvidia 显卡驱动 + Cuda 8.0 (问题总结 + 解决方案)

来源:互联网 发布:小米wifi软件下载 编辑:程序博客网 时间:2024/05/15 04:33

前言

前面好一阵子忙于写论文和改论文,好久没有做新实验了,最近又回到做实验是的节奏,这感觉很爽。 去年实验室买了两台工作站(4路Titanx+2颗 Xeon CPU E5-2637 v3 @ 3.50GHz),刚开始安装cuda实在是糟心,花了一两天没有搞定,后来请教了一些大牛,搞定了,今年实验室又买了两台差不多服务器,只是GPU为 Titanx(Pascal),本以为安装Nvidia驱动和去年一样,然而事与愿违,相信很多人和我有相同的遭遇,今天我把我遇到的问题给大家总结一下。 第一次写博客,写的不好希望大家见谅,以后我写一些深度学习,行为识别,行为检测的博客,也希望同行互相交流。我的 邮箱在博客底部。

安装Nvidia驱动出现的问题

问题主要是三种,(1)循环登录,也就是登录之后在退出来到登录界面; (2)界面变得很大,看着心慌,哈哈;(3)登录进去了,显示正常了,结果只有桌面背景和鼠标。

安装Ubuntu环境下Nvidia驱动几种方式

总的说,安装显卡驱动的方式有如下几种:
- 直接去nvidia官网下载驱动包安装(网址:http://www.nvidia.cn/Download/index.aspx?lang=cn)
- 从PPA中安装(参考博文:http://blog.csdn.net/qiusuoxiaozi/article/details/70195689)
- 直接通过安装Cuda8.0带的驱动(网址:https://developer.nvidia.com/cuda-downloads)

首先,我简单的说一下这几中方式的具体操作,因为每个童鞋遇到的问题不一样,这三种方式必然有一种能够满足你的需求,所以都值得你去试试,反正我是都试过了(此时泪崩中)。 在这三种方法中,最重要的就是你首先知道你该装那个版本的驱动,方式如下:

sudo apt-cache search nvidia*
  • 1

结果如下:
这里写图片描述
可以看到我的电脑最高可支持nvidia-375.66的驱动(有种说法这是支持最高的驱动,但是试了,这个说法不太对,我装了比较版本高的驱动,成功了,所以我觉得这步可以去掉,写出来主要是考虑更多人的需要)。有了版本就好办了。

第一种方式,我下载了NVIDIA-Linux-x86_64-375.66.run (根据你的版本号下载),具体的安装过程如下(可参考师弟的博客:http://blog.csdn.net/u012759136/article/details/53355781):

卸载掉原有驱动

sudo apt-get purge nvidia*
  • 1

这个也和重要,我的有一台服务器没有这个操作,还真不行。如果使用的是runfile,则使用–uninstall 参数,当然runfile安装的时候会卸载掉之前的驱动,所以可以不用手动去卸载。

禁用nouveau

(参考:http://www.cnblogs.com/Qwells/p/6086773.html#undefined)
新建blacklist-nouveau.conf文件,输入命令:

sudo gedit /etc/modprobe.d/blacklist-nouveau.conf
  • 1

往文件中写入:

blacklist nouveaublacklist lbm-nouveauoptions nouveau modeset=0alias nouveau offalias lbm-nouveau off
  • 1
  • 2
  • 3
  • 4
  • 5

保存并退出。这一步是为了禁掉Ubuntu自带开源驱动nouveau。之后sudo reboot重启系统。在终端执行命令:

lsmod | grep nouveau
  • 1

查看nouveau模块是否被加载。如果什么都没输出,则执行下一步。
给驱动run文件赋予执行权限

sudo chmod a+x NVIDIA-Linux-x86_64-375.66.run
  • 1

Ctrl + Alt + F1 进入tty1(Ctrl + Alt + F7是回到桌面系统)出现上面的问题,根本原因在于 参数: –no-opengl-files

sudo /etc/init.d/lightdm stopsudo ./NVIDIA-Linux-x86_64-375.20.run --no-opengl-filessudo /etc/init.d/lightdm start
  • 1
  • 2
  • 3

–no-opengl-files也就是不安装opengl,这里的原因有很多种,可能是因为ubuntu桌面系统是采用3D渲染的,可能是驱动冲突问题。当然还有其他几个参数,都值得你去试一试:

在安装驱动的时候,有一布问你”Would you like to run the nvidia-xconfig utility to automatically update your X configuration file…”什么的,选择 No。

sudo ./NVIDIA-Linux-x86_64-375.20.run --no-opengl-files –no-x-check –no-nouveau-check
  • 1
  • –no-x-check 安装驱动时不检查X服务
  • –no-nouveau-check 安装驱动时不检查nouveau

重启电脑,没有问题,输入命令:

nvidia-smi
  • 1

出现:
这里写图片描述
没有问题,接下来装cuda的时候不要在装驱动了,具体选项如下:

DescriptionThis package includes over 100+ CUDA examples that demonstratevarious CUDA programming principles, and efficient CUDAimplementation of algorithms in specific application domains.The NVIDIA CUDA Samples License Agreement is available inDo you accept the previously read EULA?accept/decline/quit: acceptInstall NVIDIA Accelerated Graphics Driver for Linux-x86_64 367.48?(y)es/(n)o/(q)uit: nInstall the CUDA 8.0 Toolkit?(y)es/(n)o/(q)uit: yEnter Toolkit Location [ default is /usr/local/cuda-8.0 ]:Do you want to install a symbolic link at /usr/local/cuda?(y)es/(n)o/(q)uit: yInstall the CUDA 8.0 Samples?(y)es/(n)o/(q)uit: yEnter CUDA Samples Location [ default is /home/c302 ]:Installing the CUDA Toolkit in /usr/local/cuda-8.0 ...Installing the CUDA Samples in /home/c302 ...Copying samples to /home/c302/NVIDIA_CUDA-8.0_Samples now...Finished copying samples.
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31

到目前为止,这种方法安装大功告成了,我用的就是这种方法解决问题的,那么接下来简单的介绍另两种方法。

小技巧提示,如果你装驱动失败,进不去系统了,可能有的同志不知道怎么做了,就直接系统重装,这是一种方式,但是最简单的方式是,进文本tty1模式,输入命令:

sudo /etc/init.d/lightdm stopsudo ./NVIDIA-Linux-x86_64-375.20.run --uninstallsudo /etc/init.d/lightdm start
  • 1
  • 2
  • 3

系统回到从前,继续做打不死的小强,继续试试。

第二种,利用PPA的方式,参考是http://blog.csdn.net/qiusuoxiaozi/article/details/70195689。 配置好了PPA(不一定必须配置,看你的源有没有),指令就是:

sudo apt-get install nvidia-375
  • 1

注意,这里的版本号nvidia-375 是通过上面的方式获取到的(sudo apt-cache search nvidia*)。但是这种方式,并不是适合所有人,比如我试了两台服务器,都是登录不进去,但是网上有博主解决了问题,说明有些童鞋是可以试试的,如果不行,就进tty1执行命令:

sudo apt-get purge nvidia-375
  • 1

回到解放前,继续试试,哈哈。

第三种,这是我去年用的方式,因为下载的cuda文件有.deb 和 .run两种格式, cuda安装文件里面自带Nvidia驱动的。但是,直接装deb的 基本上是直接开挂,一直如此从未改变过,所以我早就放弃了,但是同样网上有同志就可以了,运气真好,你也可以试试。
第一次成功,我是用cuda_8.0.61_375.26_linux.run方式,解决的方法是:驱动安装选y(第一种方式选N是以为驱动是单独安装的),但是问你要不要安装opengl的时候,一定要选择n,其他一路选择y,重启,没有问题。

小弟不才,写了一堆,希望能帮助你解决问题,有问题可以给我发邮件:swzhang@hust.edu.cn.

阅读全文
0 0
原创粉丝点击