Ubuntu16.04.3LTS+CUDA8.0+cudnn5.1+tensorflow-gpu(1.2)安装配置信息汇总

来源:互联网 发布:iphone神器软件 编辑:程序博客网 时间:2024/05/01 12:13

花了一周的时间,终于把一块750Ti的显卡成功配置到了机器上,网上相关信息太多,这里集合一下各个教程的有用信息,希望能够帮助到各位GPU核武器玩家


Ubuntu 16.04.3 LTS

基本安装

由于是Server版,直接参考信息较少,按照大部分教程也可以完成安装。
我在安装的时候主要参考的是这位同行的教程:

  • 首先利用WinSetupFromUSB这个软件(其它软件也可以),把安装包制作成U盘启动工具。这里要注意,制作成功的U盘启动盘插在自己电脑上应该是显示内存为0,否则失败。
  • 我的主机是插着网线的。建议插着网线安装,因为后面会需要确定时区、下载一些工具。网线安装的另一个好处是不需要配置基本网络信息,他会根据情况自动配置

    其中有很多内容,主要是Ubuntu安装部分的教程,其他教程我选择方式和他不一样,但是还是提供了很好的帮助,在此表示感谢!(https://zhuanlan.zhihu.com/p/27794010)

  • 重启主机,按delete键(主机不同情况不一样),进入U盘启动U界面

  • 出现选项界面,选择第一项:Install Ubuntu Server
  • 全程选择美国英文安装、键盘也选择US,避免出现问题(第二次安装的时候就搞错了键盘配置,导致系统出现“♦”乱码,网上解决方案也不太好施行,只有再次重装)!
  • 如果没有特殊要求,就默认LVM自动分区,没多大影响。
  • 我是把主机磁盘都拿来分区了,覆盖了之前的内容,就是这么暴力(前提是确认以前的系统重要文件做了备份…)注意看,别把自己U盘给处理了
  • 后面选择要安装的软件组合,默认的之外只需要加一个Openssh-Server就行了

配置用户,为ssh远程操作铺路

然后就是创建用户组、分配用户:

groupadd group1

第一行命令向系统中增加了一个新组group1,新组的组标识号是在当前已有的最大组标识号的基础上加1。

useradd -g group1 user1

第二行命令在group1中添加了一个user1

然后输入ifconfig,查看主机的ip地址,就可以利用secureCRT远程连接安装了(好处就是…可以复制代码,时间太长的安装,再回主机进行)下图是我的ifconfig之后查看到的ip
这是我的ifconfig之后查看到的ip

升级和配置基本环境

执行如下代码:

sudo apt updatesudo apt upgradesudo apt install -y python-dev python-pip python-nose gcc g++ git gfortran vimsudo apt install -y libopenblas-dev liblapack-dev libatlas-base-dev

Nvidia-driver安装

之前一周本来装好了一个,结果由于显卡没有供电,还特意去买了一个电源,结果还是不行,主板不合适,后来不得不换一个机箱。
新机箱新主板,空间也大了,插显卡轻松许多…主要是能正常工作!!!
安装驱动很简单,建议在NVIDIA官网(显卡型号查询链接)查询自己的机子对应的版本号:注意产品类型和产品家族,因为产品系列在服务器中是查不到的。下图是我查的对应的驱动型号(即使安错了也无所谓,可以无痛卸载的嘛)
这里写图片描述

然后就有三种方式安装驱动:

  • 方法1:apt-get方式
    执行如下代码:
sudo apt-get updatesudo apt-get install nvidia-375sudo apt-get install mesa-common-devsudo apt-get install freeglut3-dev
  • 方法2:wget 驱动文件下载网址
sudo sh "驱动文件"
  • 方法3:手动下载驱动文件
    然后利用SecureCRT rz上传到服务器,执行安装命令
sudo sh "驱动文件"

安装完成之后,执行reboot命令重启服务器,输入nvidia-smi,就可以看到类似如下信息:
这里写图片描述
出现了NVIDIA的版本号,说明安装成功,显卡装好之后,已经解决了一个大坑,接下来就是另外一个大坑。

安装CUDA

  • 一定不要安装CUDA 9.0!!!一定不要!!!到时候不兼容的各种问题会让你崩溃,我就因为CUDA 9.0浪费了两天时间
  • 强烈建议自己去找CUDA8.0(我试过两种方式,某度网盘下载和自己到官网下载,都可以)
  • 下载CUDA需要注册和登陆NVIDIA开发者账号(让师兄帮我下载了一个,传到了服务器上,速度蛮快),CUDA8下载页面提供了很详细的系统选择和安装说明,这里选择了Ubuntu16.04系统runfile安装方案,千万不要选择deb方案,前方无数坑!!!不要去踩!!!

拷贝到home目录下之后,直接执行:

sudo sh cuda_8.0.44_linux.run

安装过程中可能会询问一些东西,除了一个地方,其他都是默认。当它询问是否要安装cuda包里带的驱动时,一般教程都说否,建议你选No,我也选的No。
安装完成之后把CUDA添加到系统环境变量:

sudo vim ~/.bashrc

移动到最后一个fi后面,i插入,换行,添加如下代码:(如果不对,请根据自己实际安装的路径调整环境变量的设置)

  • 这是一般教程给的环境变量设置
export PATH=/usr/local/cuda-8.0/bin${PATH:+:${PATH}}export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

ESC:wq保存退出

  • 我的机器上一般教程给的环境变量设置不行,我改成了:
export PATH=/usr/local/cuda-8.0/bin:$PATHLD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64:$LD_LIBRARY_PATH

ESC:wq保存退出

source ~/.bashrc

reboot重启,输入 nvcc -V,查看CUDA信息:
这里写图片描述

出现类似信息即成功!
本人在安装的时候出现如下情况,低权限用户无法执行nvcc -V 查看CUDA版本,思考之后发现,环境变量没有在低权限用户当中加进去,再次把每个用户CUDA环境变量设置了一遍:

export PATH=/usr/local/cuda-8.0/bin:$PATHLD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64:$LD_LIBRARY_PATH

ESC:wq保存退出

source ~/.bashrc

输入 nvcc -V,就可以查看CUDA信息

CUDA大坑就此跨过。另外,CUDA安装过程中会问几个设置,然后可以进入CUDA目录测试CUDA实例,具体可以参考这个教程:52NLP的精品CUDA环境配置教程

cuDNN安装

在官网下载(下载对应版本的cuDNN)对应的cuDNN版本的安装包,同样可以用wget或者本地下载rz上传服务器。安装cuDNN比较简单,解压后把相应的文件拷贝到对应的CUDA目录下即可。
将下载好的安装包用以下命令运行:

tar xvzf cudnn-8.0-linux-x64-v5.1.tgz

cd到新解压出来的CUDA文件夹:(注意cuda和cuda-8.0文件夹…有一次错误就是因为这个)

sudo cp cuda/include/cudnn.h /usr/local/cuda-8.0/include/sudo cp cuda/lib64/libcudnn* /usr/local/cuda-8.0/lib64/sudo chmod a+r /usr/local/cuda-8.0/include/cudnn.hsudo chmod a+r /usr/local/cuda-8.0/lib64/libcudnn*

cuDNN安装完成。

Tensorflow-gpu(1.2)版本安装

注意一定要选择1.2版本,否则会报错无,高版本暂时和cuDNN不匹配

pip install tensorflow-gpu==1.2

安装成功之后进入python

import tensorflow as tf

没有报错,说明完美安装成功!
开始get hands dirty吧!

阅读全文
1 0
原创粉丝点击