Ubuntu14.04 + Nvidia Cuda8.0 + Caffe

来源:互联网 发布:淘宝店铺等级排行 编辑:程序博客网 时间:2024/05/18 20:32

** note: 由于输入法的原因,代码中的“-”可能运行错误,粘贴代码时,请自动修改, 例如 修改“update-initramfs -u”中的“-u”. 避免出现运行错误。

1.系统信息
Linux mint 17.3 64bit
(Mint每次重启都会出现Xserver不能启动的问题)
Ubuntu 14.04
( 最好是Ubuntu, 问题很少)
GeForce GTX 750 Ti
gcc 4.8.4 (matlab2014a不支持4.8,之后需要降级到4.7)

2.Nvidia driver

Ubuntu可以选择自动安装:
system setting-> software updates->other additional drivers
强烈建议这个方法

手动安装的方法如下:

1)禁用nouveau

$ sudo vi /etc/modprobe.d/blacklist.conf+ blacklist nouveau$ sudo vi /etc/default/grub      (kernel 行)+ nouveau.modeset=0  blacklist=nouveau
  • 1
  • 2
  • 3
  • 4

或者

$ sudo nano /etc/modprobe.d/disable-nouveau.conf+blacklist nouveau+options nouveau modeset=0

个人感觉两种方法是一样的

2) 重新构建initramfs

$ sudo update-initramfs -u$ sudo reboot
  • 1
  • 2

3) CTR+ALT+F1 模式下

$ sudo service mdm stop$ sudo chmod 755 NVIDIA/Linux-x86_64.run$ sudo sh ./NVIDIA-Linux-x86_64.run  $ sudo service mdm start
  • 1
  • 2
  • 3
  • 4

4) 重启电脑

$ sudo reboot
  • 1

5) 验证是否正确

$ lspci –vnn | grep VGAA 12$ nvidia-smi$ glxinfo | grep OpenGL$ glxgears$ glmark2
  • 1
  • 2
  • 3
  • 4
  • 5

3.Cuda8.0 ( Linux x86_64 Unumtu 14.04 )
1) 安装缺少的库

$ sudo apt-get install freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libglu1-mesa libglu1-mesa-dev $ sudo apt-get install libgl1-mesa-glx
  • 1
  • 2

// libgl1-mesa-glx有时候装不上,不过好像也没关系

$ sudo apt-get install vim
  • 1

2) 进入CUDA run文件的文件夹

$ sudo sh cuda_8.0.44_linux.run
  • 1

不用安装nvidia driver, 其他项接受

3) 设置环境变量
尝试这个,据说这个文件是默认的

$ sudo vi ~/.bashrc+ export PATH=/usr/local/cuda-8.0/bin:$PATH+ export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64:$LD_LIBRARY_PATH$ source ~/.bashrc
  • 1
  • 2
  • 3
  • 4

或者:

$ sudo vi /etc/profile+ export PATH=/usr/local/cuda-8.0/bin:$PATH+ export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64:$LD_LIBRARY_PATH+ export PATH=/usr/local/cuda/bin:$PATH+ export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH$ sudo ldconfig
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

下面的操作类似,保险起见,两个都试试

$ sudo vi /etc/bash.bashrc+ export PATH=/usr/local/cuda-8.0/bin:$PATH+ export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64:$LD_LIBRARY_PATH$ source /etc/bash.bashrc
  • 1
  • 2
  • 3
  • 4

三种方法应该是一样的效果,建议先尝试第一种,亲测有效

$ sudo ldconfig  //环境变量立即生效
  • 1
$ env//查看是否环境变量是否正确 或者 $ echo $PATH | echo $LD_LIBRARY_PATH
  • 1
  • 2

4) 验证安装是否完成

$ nvidia-smi$ nvcc –V
  • 1
  • 2

5) Cuda samples
编译所有的cuda samples

$ cd /home/username/NVIDIA_CUDA-8.0_Samples$ sudo make
  • 1
  • 2

也可以进入/usr/local/cuda-8.0/samples/1_Utilities/deviceQuery/目录下

$ sudo make$ ./deviceQuery
  • 1
  • 2

显示系统信息和最后一行pass, 证明安装成功

**To uninstall the CUDA Toolkit, run the uninstall script in /usr/local/cuda-8.0/bin

6) 安装cudnn 5.0

$ tar –zxvf cudnn-8.0-linux-x64-v5.0-ga.tgz$ sudo cp cuda/include/cudnn.h /usr/local/cuda/include/$ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/$ sudo chmod a+r /usr/local/cuda/include/cudnn.h$ sudo chmod a+r /usr/local/cuda/lib64/libcudnn*//保险起见,再cp到cuda-8.0$ sudo cp cuda/include/cudnn.h /usr/local/cuda-8.0/include/$ sudo cp cuda/lib64/libcudnn* /usr/local/cuda-8.0/lib64/$ sudo chmod a+r /usr/local/cuda-8.0/include/cudnn.h$ sudo chmod a+r /usr/local/cuda-8.0/lib64/libcudnn*$ sudo ldconfig
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12

可以运行一下 ./deviceQuery 看一下是否通过

*安装caffe时,运行make runtest 可能会出现以下错误:
Libcudart.so.8.0: can not open shared object files: no such file…
运行下面指令可以解决:

$ sudo cp /usr/local/cuda-8.0/lib64/libcudart.so.8.0 /usr/local/lib/libcudart.so.8.0$ sudo cp /usr/local/cuda-8.0/lib64/libcublas.so.8.0 /usr/local/lib/libcublas.so.8.0$ sudo cp /usr/local/cuda-8.0/lib64/libcurand.so.8.0 /usr/local/lib/libcurand.so.8.0$ sudo cp /usr/local/cuda-8.0/lib64/libcudnn.so.5 /usr/local/lib/libcudnn.so.5$ sudo ldconfig
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

4.安装Matlab214a

5.降级gcc

** note: 降级gcc,最好在安装Matlab之后进行,或者在最开始的时候进行,因为期间会出现gcc文件夹无法找到的错误。

$ sudo apt-get install –y gcc-4.7$ sudo apt-get install –y g++-4.7$ cd /usr/bin$ sudo rm gcc$ sudo ln –s gcc-4.7 gcc$ sudo rm g++ $ sudo ln –s g++-4.7 g++
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7

验证一下当前gcc版本是不是默认为4.7

6.安装caffe
1) 安装依赖项

$ sudo apt-get install libprotobuf-dev libleveldb-dev libsnappy-dev libopencv-dev libhdf5-serial-dev protobuf-compiler$ sudo apt-get install –-no-install-recommends libboost-all-dev$ sudo apt-get install libgflags-dev libgoogle-glog-dev liblmdb-dev$ sudo apt-get install python-pip$ sudo pip install protobuf$ sudo apt-get install cmake git libgtk2.0-dev pkg-config libavcodec-dev libavformat-dev libswscale-dev
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

2) BLAS 安装

$ sudo apt-get install libatlas-base-dev
  • 1

3) 安装pycaffe接口所需要的依赖项

$ sudo apt-get install python-numpy python-scipy python-matplotlib python-sklearn python-skimage python-h5py python-protobuf python-leveldb python-networkx python-nose python-pandas python-gflags cython ipython
  • 1

4) 安装openCV3.1

$ cd opencv-3.1.0/modules/cudalegacy/src
  • 1

修改graphcuts.cpp(因为opencv3.1还不支持cuda8.0)

#if !defined(HAVE_CUDA) || defined(CUDA_DISABLER) || (CUDART_VERSION >= 8000)
  • 1

进入opencv目录 (如果没有cmake,请装)

$ mkdir build$ cd build$ sudo cmake –D CMAKE_BUILD_TYPE=ReleaseD CMAKE_INSTALL_PREFIX=/usr/local ..$ sudo make –j16$ sudo make install
  • 1
  • 2
  • 3
  • 4
  • 5

5) Caffe

进入Caffe文件夹,并复制Makefile.config及修改

$ cp Makefile.config.example Makefile.config$ sudo gedit Makefile.config
  • 1
  • 2

修改Makefile.config,按照自己的需求修改

USE_CUDNN :=1OPENCV_VERSION := 3MATLAB_DIR := /usr/local/MATLAB/R2014a
  • 1
  • 2
  • 3

保存

$ cd ..
  • 1
//这段可有可无,前面依赖项都装好,这步可以不要$ cd caffe/python$ for req in $(cat requirements.txt); do pip install $req; done$ cd ..
  • 1
  • 2
  • 3
  • 4

最后一步,

$ sudo make all -j16$ sudo make test -j16$ sudo make runtest -j16$ sudo make pycaffe$ sudo make matcaffe
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

搞定,收工回家

6) Test MNIST 根据官网测试MNIST

7.安装jupyter,在线编辑工具

$ sudo pip install jupyter
  • 1
  1. 可能出现的问题

如果出现Segmentation fault错误,原因可能是依赖项没有装全。
如果出现.so libraries缺失,原因可能是环境变量没有配置好。
如果出现hd5f错误, 可以尝试在caffe配置文件下面修改

INCLUDE_DIRS := $(PYTHON_INCLUDE) /usr/local/include /usr/lib/x86_64-linux-gnu/hdf5/serial/includeLIBRARY_DIRS := $(PYTHON_LIB) /usr/local/lib /usr/lib /usr/lib/x86_64-linux-gnu/hdf5/serial
  • 1
  • 2
  • 3

如果重启之后显示Xserver不能启动,原因可能是mdm没有设置好

$ sudo service mdm restart
  • 1

或者重新安装mdm

$ sudo apt-get remove mdm$ sudo apt-get install mdm
  • 1
  • 2

还是建议安装Ubuntu,而不是linux mint
(mint下面尝试了好几次,都是这个问题)

都是血和泪,从头到尾装了好几天,每次都是折在了最后一步,要不然就是重启之后Xserver不能启动

参考了前辈的经验: http://www.2cto.com/os/201607/528798.html

原创粉丝点击