Ubuntu16.04+cuda8.0+cudnn6.0+tensorflow(二)

来源:互联网 发布:c语言 switch case 编辑:程序博客网 时间:2024/06/05 14:24

边走边说我踩过的那些坑儿

Ubuntu16.04下安装Cuda8.0

参考链接1:http://blog.csdn.net/masa_fish/article/details/51882183

参考链接2:http://blog.csdn.net/applecore123456/article/details/56682851


准备工具:

1.显卡

2.显卡驱动

3. Cuda toolkit



步骤:

第一步:确认显卡是否支持CUDA,支持Cuda的显卡以及计算能力

参考:https://developer.nvidia.com/cuda-gpus


第二步:安装显卡驱动


1. 装完Ubuntu系统以后,可利用

sudo apt-get update

sudo apt-get upgrade

来更新系统。


2. 更新完系统以后,打开系统设置 -> 软件和更新 -> 附加驱动,如下图:


在未安装nvidia的驱动之前,使用的是X.Org X server

我们只需要选择使用NVIDIA binary driver,后面括号是(专有,tested)的选项,然后点击应用更改

等待完成.....


3. 测试显卡驱动是否安装好

可以在终端用nvidia-smi测试,如下图,显卡驱动是否装好。如果安装成功,用nvidia-smi测试出来的结果会包含显卡的版本


或者在开始那里搜索nvidia,会出现NVIDIA X Serve Settings这样一个软件,如果有这个软件,显卡驱动已经装好


第三步:安装CUDA 8.0

(参考:http://docs.nvidia.com/cuda/cuda-installation-guide-linux/


1. 检查自己的GPU是否支持CUDA:

$ lspci | grep -i nvidia

显示GPU的版本信息


2. 检查自己的Linux系统是否支持CUDA

(每一版CUDA toolkit只支持某些版本的linux系统,具体可查看官网中CUDA toolkit的release notes):

$ uname -m && cat /etc/*release


3. 检查gcc的版本信息

gcc --version


4. 检查是否安装了kernel header和 package development

查看内核:

$ uname -r
安装内核版本对应的kernel header和package development
$ sudo apt-get install linux-headers-$(uname -r)


5. 选择安装方式:这里选择了.run文件的安装方式,其他的不予说明

下载系统对应的.run文件:https://developer.nvidia.com/cuda-downloads

这里注意版本,因为这里有坑:如果CUDA toolkit最新版刚出来,安装时要慎重。比如,安装了CUDA 9.0,但是tensorflow还不支持CUDA 9.0.


6. 禁用nouveau

$ lsmod | grep nouveau
如果上面的命令没有任何输出的话,则nouveau是禁用的,否则,可以利用以下两步禁用nouveau

$ sudo gedit /etc/modprobe.d/blacklist-nouveau.conf
加入以下两句:
blacklist nouveauoptions nouveau modeset=0
打开终端,输入:
$ sudo /sbin/mkinitrd
禁用nouveau以后,也可以利用下面语句测试是否禁用成功:

$ lsmod | grep nouveau


7. 重新启动电脑,登录账户之前,用CTRL+ALT+F1进入命令行模式,然后登录自己的账户


8. 输入

$ sudo service lightdm stop

关闭图形化界面


9. 切换到保存CUDA .run文件的路径,然后输入

$ sudo sh cuda_8.0.61_375.26_linux.run
安装8.0版本的CUDA


10. 安装过程中,不要一直选择yes或者enter,否则会入坑。

      a. 是否选择接受协议:输入accept

      b. 在选择是否安装nvidia显卡驱动的时候,一定要选择no,否则安装完成以后,会遇到循环登录的问题

      c. 是否安装CUDA toolkit,输入y

      d. CUDA toolkit安装路径,默认就可以

      e. CUDA samples,可以安装,安装路径默认就可以


11. 加入环境变量:

 打开终端,输入:

$ sudo gedit ~/.bashrc
在文件末尾,加入以下几句:
export PATH=/usr/local/cuda-8.0/bin:$PATHexport LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64/
关闭文件,在终端输入
$ source ~/.bashrc
则环境变量生效


12. 确认是否安装成功

nvcc -V
可查看版本信息


实测效果:入了两个坑

1. 在安装CUDA toolkit时,一路选择yes或者enter,于是成功进入循环登录模式。怎么办?卸载重装。卸载方法:

$ sudo /usr/local/cuda-8.0/bin/uninstall_cuda_8.0.pl
2. 安装了CUDA 9.0,但是目前tensorflow不支持CUDA 9.0.果断卸载9.0,重回8.0

http://ju.outofmemory.cn/entry/328609

不是查到这个链接,也许我要在这个坑里待很久……


祝大家安装CUDA顺利……

阅读全文
0 0