ubuntu 16.04 + GTX 1080 DeepLearning工作站搭建

来源:互联网 发布:java生成log日志文件 编辑:程序博客网 时间:2024/04/30 16:03

本文安装过程参考了这两篇博客,但安装过程中还是出现了许多奇怪的bug,特此记录。

  • [DIGITS/docs/BuildCaffe.md]
  • [Build Personal Deep Learning Rig: GTX 1080 + Ubuntu 16.04 + CUDA 8.0RC + CuDnn 7 + Tensorflow/Mxnet/Caffe/Darknet
    ]
  • [Ubuntu16.04+cuda8.0+caffe安装教程]

背景介绍

回到实验室就撺掇着老板给我配个带GPU的工作站,然后我就作死配置了两块 GTX1080 的服务器。确实比较坑,显卡内存8G过小的问题我目前还没有遇到,但估计以后还是会遇到的。由于是最新的显卡,所以CUDA只能安装最新的版本(CUDA 8.0),以及相应的cudnn(5.1)。此外,由于最新的ubuntu16.04的gcc编译器都是最新的的版本(5.4),所以也出现了一些小问题。下面我们一点一点克服。

系统安装

直接略过,请参考我的第一个引用的系统安装过程,我是使用U盘安装的。

GTX1080驱动安装

请仔细读完再进行操作!!!!我不是很熟悉linux的操作,所以最开始还是被坑了不少。额,比较二的是,新电脑刚回来的时候,我一直拿vga的先插在系统的输出上,发现一直没有显示,当时怀疑是电脑有问题,就急忙质询卖家,得到的答复是,因为插了GPU,视频从GPU输出!!!!(感觉自己没有智商了)。不多说,进入正题。[参考教程]

  • 下载[GTX1080驱动]
  • CTRL+ALT+F1 然后登陆你的账号(这点请注意,我是第一次使用ubuntu,这三个键按完之后会进入类似dos的界面,上面让你login指的是让你先输入你的用户名,然后就可以输入密码登陆了。我白痴的以为直接输入密码,折腾了半天,并且还不知道怎么返回,一直卡在这。其实返回图形界面是很容易的 CTRL+ALT+F7 即可回到图形界面)
  • 关闭 X server,sudo service lightdm stop
  • sudo init 3 然后找到相应的路径运行 sudo NVIDIA-Linux-x86_64-367.27.run.
  • 安装结束后sudo service lightdm start来开启X server,CTRL+ALT+F7就可以进入图形界面了,这个时候,你会发现,你的屏幕的清晰度炸裂。
可能会遇到的问题
  • 直接运行NVIDIA-Linux-x86_64-367.27.run 得到的结果是失败!!!!提示你要使用管理员权限
  • 然后sudo NVIDIA-Linux-x86_64-367.27.run 依然失败,按照上面的方法安装就可以了。

CUDA 8.0安装

请仔细读完再进行操作!!!!

  • 下载[CUDA 8.0RC],这个需要你先注册,一点一点来。然而,注意选择版本!!!!一定要下载runfile版本,其他版本都不带gtx1080的驱动!!!

linux -> x86_64 -> Ubuntu -> 16.04 -> runfile -> Base Installer(1.4GB)

  • 然后就是安装,sudo sh cuda_8.0.27_linux.run
  • 安装过程中,狂按space很快就跳到协议的最下端,第一条肯定是accept
  • 但是一定要注意,让你安装驱动那个一定要输入n!不然之前装的驱动就白费了,而且他让你装的驱动也是很古老的。这也是为什么不下载deb版本的原因,deb版本虽然傻瓜,可是驱动不支持gtx1080,以后估计肯定会支持,deb版本的优势是纯傻瓜式操作,不用配置地址之类的东西。
Do you accept the previously read EULA?accept/decline/quit: acceptInstall NVIDIA Accelerated Graphics Driver for Linux-x86_64 361.77?(y)es/(n)o/(q)uit: n
  • 安装完毕后,再声明一下环境变量,并将其写入到 ~/.bashrc 的尾部:
export PATH=/usr/local/cuda-8.0/bin${PATH:+:${PATH}}export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
  • 然后设置环境变量和动态链接库,在命令行输入:
$ sudo gedit /etc/profile
  • 在打开的文件末尾加入:export PATH = /usr/local/cuda/bin:$PATH
  • 保存之后,创建链接文件:sudo gedit /etc/ld.so.conf.d/cuda.conf在打开的文件中添加如下语句:/usr/local/cuda/lib64

  • 然后执行sudo ldconfig使链接立即生效。

可能会遇到的问题
  • 安装的时候遇到不支持的编译器,需要你把sudo sh cuda_8.0.27_linux.run -override

cudnn 5.1安装

请仔细读完再进行操作!!!!

可能会遇到的问题

caffe安装

请仔细读完再进行操作!!!!

可能会遇到的问题

matconvnet安装

请仔细读完再进行操作!!!!

可能会遇到的问题
0 0
原创粉丝点击