Ubuntu16.04.3LTS+CUDA8.0+cudnn5.1+tensorflow-gpu(1.2)安装配置信息汇总

来源：互联网发布：iphone神器软件编辑：程序博客网时间：2024/05/01 12:13

花了一周的时间，终于把一块750Ti的显卡成功配置到了机器上，网上相关信息太多，这里集合一下各个教程的有用信息，希望能够帮助到各位GPU核武器玩家

Ubuntu 16.04.3 LTS

基本安装

由于是Server版，直接参考信息较少，按照大部分教程也可以完成安装。
我在安装的时候主要参考的是这位同行的教程：

首先利用WinSetupFromUSB这个软件（其它软件也可以），把安装包制作成U盘启动工具。这里要注意，制作成功的U盘启动盘插在自己电脑上应该是显示内存为0，否则失败。
我的主机是插着网线的。建议插着网线安装，因为后面会需要确定时区、下载一些工具。网线安装的另一个好处是不需要配置基本网络信息，他会根据情况自动配置

其中有很多内容，主要是Ubuntu安装部分的教程，其他教程我选择方式和他不一样，但是还是提供了很好的帮助，在此表示感谢！(https://zhuanlan.zhihu.com/p/27794010)
重启主机，按delete键（主机不同情况不一样），进入U盘启动U界面
出现选项界面，选择第一项：Install Ubuntu Server
全程选择美国英文安装、键盘也选择US，避免出现问题（第二次安装的时候就搞错了键盘配置，导致系统出现“♦”乱码，网上解决方案也不太好施行，只有再次重装）！
如果没有特殊要求，就默认LVM自动分区，没多大影响。
我是把主机磁盘都拿来分区了，覆盖了之前的内容，就是这么暴力（前提是确认以前的系统重要文件做了备份…）注意看，别把自己U盘给处理了
后面选择要安装的软件组合，默认的之外只需要加一个Openssh-Server就行了

配置用户，为ssh远程操作铺路

然后就是创建用户组、分配用户：

groupadd group1

第一行命令向系统中增加了一个新组group1，新组的组标识号是在当前已有的最大组标识号的基础上加1。

useradd -g group1 user1

第二行命令在group1中添加了一个user1

然后输入ifconfig，查看主机的ip地址，就可以利用secureCRT远程连接安装了（好处就是…可以复制代码，时间太长的安装，再回主机进行）下图是我的ifconfig之后查看到的ip
这是我的ifconfig之后查看到的ip

升级和配置基本环境

执行如下代码：

sudo apt updatesudo apt upgradesudo apt install -y python-dev python-pip python-nose gcc g++ git gfortran vimsudo apt install -y libopenblas-dev liblapack-dev libatlas-base-dev

Nvidia-driver安装

之前一周本来装好了一个，结果由于显卡没有供电，还特意去买了一个电源，结果还是不行，主板不合适，后来不得不换一个机箱。
新机箱新主板，空间也大了，插显卡轻松许多…主要是能正常工作！！！
安装驱动很简单，建议在NVIDIA官网（显卡型号查询链接）查询自己的机子对应的版本号：注意产品类型和产品家族，因为产品系列在服务器中是查不到的。下图是我查的对应的驱动型号（即使安错了也无所谓，可以无痛卸载的嘛）
这里写图片描述

然后就有三种方式安装驱动：

方法1：apt-get方式
执行如下代码：

sudo apt-get updatesudo apt-get install nvidia-375sudo apt-get install mesa-common-devsudo apt-get install freeglut3-dev

方法2：wget 驱动文件下载网址

sudo sh "驱动文件"

方法3：手动下载驱动文件
然后利用SecureCRT rz上传到服务器，执行安装命令

sudo sh "驱动文件"

安装完成之后，执行reboot命令重启服务器，输入nvidia-smi，就可以看到类似如下信息：
这里写图片描述
出现了NVIDIA的版本号，说明安装成功，显卡装好之后，已经解决了一个大坑，接下来就是另外一个大坑。

安装CUDA

一定不要安装CUDA 9.0！！！一定不要！！！到时候不兼容的各种问题会让你崩溃，我就因为CUDA 9.0浪费了两天时间
强烈建议自己去找CUDA8.0（我试过两种方式，某度网盘下载和自己到官网下载，都可以）
下载CUDA需要注册和登陆NVIDIA开发者账号（让师兄帮我下载了一个，传到了服务器上，速度蛮快），CUDA8下载页面提供了很详细的系统选择和安装说明，这里选择了Ubuntu16.04系统runfile安装方案，千万不要选择deb方案，前方无数坑！！！不要去踩！！！

拷贝到home目录下之后，直接执行：

sudo sh cuda_8.0.44_linux.run

安装过程中可能会询问一些东西，除了一个地方，其他都是默认。当它询问是否要安装cuda包里带的驱动时，一般教程都说否，建议你选No，我也选的No。
安装完成之后把CUDA添加到系统环境变量：

sudo vim ~/.bashrc

移动到最后一个fi后面，i插入，换行，添加如下代码：（如果不对，请根据自己实际安装的路径调整环境变量的设置）

这是一般教程给的环境变量设置

export PATH=/usr/local/cuda-8.0/bin${PATH:+:${PATH}}export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

ESC，：wq保存退出

我的机器上一般教程给的环境变量设置不行，我改成了：

export PATH=/usr/local/cuda-8.0/bin:$PATHLD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64:$LD_LIBRARY_PATH

ESC，：wq保存退出

source ~/.bashrc

reboot重启，输入 nvcc -V,查看CUDA信息：
这里写图片描述

出现类似信息即成功！
本人在安装的时候出现如下情况，低权限用户无法执行nvcc -V 查看CUDA版本，思考之后发现，环境变量没有在低权限用户当中加进去，再次把每个用户CUDA环境变量设置了一遍：

export PATH=/usr/local/cuda-8.0/bin:$PATHLD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64:$LD_LIBRARY_PATH

ESC，：wq保存退出

source ~/.bashrc

输入 nvcc -V,就可以查看CUDA信息

CUDA大坑就此跨过。另外，CUDA安装过程中会问几个设置，然后可以进入CUDA目录测试CUDA实例，具体可以参考这个教程：52NLP的精品CUDA环境配置教程

cuDNN安装

在官网下载（下载对应版本的cuDNN）对应的cuDNN版本的安装包，同样可以用wget或者本地下载rz上传服务器。安装cuDNN比较简单，解压后把相应的文件拷贝到对应的CUDA目录下即可。
将下载好的安装包用以下命令运行：

tar xvzf cudnn-8.0-linux-x64-v5.1.tgz

cd到新解压出来的CUDA文件夹:（注意cuda和cuda-8.0文件夹…有一次错误就是因为这个）

sudo cp cuda/include/cudnn.h /usr/local/cuda-8.0/include/sudo cp cuda/lib64/libcudnn* /usr/local/cuda-8.0/lib64/sudo chmod a+r /usr/local/cuda-8.0/include/cudnn.hsudo chmod a+r /usr/local/cuda-8.0/lib64/libcudnn*

cuDNN安装完成。

Tensorflow-gpu（1.2）版本安装

注意一定要选择1.2版本，否则会报错无，高版本暂时和cuDNN不匹配

pip install tensorflow-gpu==1.2

安装成功之后进入python

import tensorflow as tf

没有报错，说明完美安装成功！
开始get hands dirty吧！

阅读全文

1 0