机器学习环境搭建:GTX970+Ubutnu1404_64bit+TensorFlow(GPU)

来源:互联网 发布:md5算法java实现 编辑:程序博客网 时间:2024/04/29 22:51
TF的GPU版本需要安装CUDA和cuDNN,而在Ubuntu中安装显卡驱动稍微麻烦一点。下面的安装比较简单:

1.检查显卡支持情况
https://developer.nvidia.com/cuda-gpus
2.下载一些东西

显卡的驱动:http://www.geforce.cn/drivers
cuda7.5 tool kit(需要注册):https://developer.nvidia.com/cuda-downloads(下载runfile就可以了
cuDNN(需要注册):https://developer.nvidia.com/rdp/cudnn-download(简单的选择v4,v5需要TF从源码安装)
(图片是对应的下载界面)
3.安装显卡驱动
简要说明:Ubuntu的GPU驱动安装稍微麻烦一点,而安装tool kit会提示是否安装显卡驱动,问题是顺着tool kit安装显卡驱动是走不通的,所以显卡驱动要单独安装。

麻烦点:只要N卡运行,X server服务就有,需要手动关闭:


ctrl+alt+F1 进入命令行模式,关掉方式:sudo /etc/init.d/lightdm stop,然后开始安装夏卡驱动:


直接运雄驱动的*.run文件即可。中间会有提示,选yes没有害处,可能会提示卸载之前的驱动,选yes即可。最后提示安装成功,会回到图像桌面,手动重启一下。


4.安装tool kit

同样进入命令行,关掉X server服务,运行run文件。除了驱动不安装外其他都是yes。安装完手动重启一下。


5.安装cuDNN

这个是把一些文件复制到指定位置即可:

tar xvzf cudnn-7.0-linux-x64-v4-prod.tgzsudo cp cuda/include/cudnn.h /usr/local/cuda/includesudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
6.添加环境变量

否则TF不知道CUDA的东西在哪里,方法:在/etc/environment文件中直接添加下面路径:

:/usr/local/cuda/lib64:/usr/local/cuda


7.安装pip和TF

默认安装TF对应使用Python2.7,想用其他的可以参考官网:https://www.tensorflow.org/versions/r0.10/get_started/os_setup.html#pip-installation

sudo apt-get install python-pip python-dev
export TF_BINARY_URL=https://storage.googleapis.com/tensorflow/linux/gpu/tensorflow-0.10.0rc0-cp27-none-linux_x86_64.whl
sudo pip install --upgrade $TF_BINARY_URL

8.测试
进入Python测试:(显示一些输入输出)
$ python...>>> import tensorflow as tf>>> hello = tf.constant('Hello, TensorFlow!')>>> sess = tf.Session()>>> print(sess.run(hello))Hello, TensorFlow!>>> a = tf.constant(10)>>> b = tf.constant(32)>>> print(sess.run(a + b))42>>>

9.可能的错误

ImportError: libcudart.so.7.0: cannot open shared object file: No such file or directory
是环境变量没设置好


0 0
原创粉丝点击