tensorflow GPU (1080ti) + win10安装笔记

来源:互联网 发布:当爱已成往事 知乎 编辑:程序博客网 时间:2024/06/05 17:26

最近一周安装tensorflow-gpu 踩坑无数,昨天安装成功后,发现如果按正确流程,又是如此简单顺利(3小时基本可以搞定)。记录下来,供大家参考,少踩本人的坑。。。


一、GPU的硬件选择

1080ti是性价比非常高的GPU,用MNIST测试,GPU版tensorflow程序比cpu版至少快20倍以上。我选择的是索泰的品牌,感觉料足(3斤多,沉甸甸),电话客服的态度和专业性也很不错。 但在选GPU时注意:

1、主机电源的是否支持。1080以上显卡是8+6pin(或8+8),需要从电源的两个接口供电(一个8转出8+6,不稳定)。对电源的稳定性和功率要求较高。1080ti额定功率250W,因此主机电源功率越大越好,700W以上较稳妥。电源如果达不到要求,GPU运行中可能会导致电脑重启。

2、显卡插槽和机箱空间是否足够。1080ti长度在30厘米多点,要注意显卡插槽延伸线上是否有凸起的元器件影响插入。显卡厚度占满两个pci槽,索泰背板还有小风扇,装上后就需要3个槽的宽度。

3、如果采用多GPU,所有GPU必须都是相同型号。


二、Windows下所需的软件与版本选择

经历这次装tensorflow-gpu出现的各种问题后,我觉得搭配好各组件版本是关键,以下是本人比较顺利安装的版本,一定还有很多其他组合,供大家参考。

版本搭配:Win10+VS2015+anaconda5.0+python3.5+CUDA8.0.61+cuDNN6.0+tensorflow-gpu1.4

接下来我写一下相关软件安装时特别注意的地方(哥的踩坑经验。。。)

对了,安装时最好关闭360这些杀毒程序,使用Administrader帐户。

1、win10 没什么说的,主要因为CUDA和cuDNN对win7的版本少。至少cuDNN6的win7版我没找到。还有网上经验说CUDA在win7下应使用8.0.44版等,既不好找,也不是主流版本,可能会和其他组件有冲突,所以建议使用win10。 另外一个细节是,win10要在线升级到较新版本,不然1080ti的驱动无法安装。好像是GPU型号越高级,对Win10版本需要越新。

2、安装VS2015。只是因为CUDA安装需要VS支持,建议使用2015。VS2013在win10下好像需要使用兼容模式安装,可能比较麻烦。

3、安装CUDA8.0.61。 第一次装CUDA可能比较晕, 新人注意以下步骤(已经安过的要全部删干净,最好连驱动也卸了重装一次,删干净相应的注册表项):

a、下载cuda8.0.61版本(NVIDIA官网是9.0版,如有需要可私信)

b、安装时仔细看英文提示,不要改路径(C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\)。首先会进行系统兼容性检查,像1080ti以上这种较高端的显卡,会提示cuda中的驱动比GPU现有的驱动版本低,建议使用现有驱动。如果出现这个提示,不用担心,在“下一步”选择安装模式时,把“默认”改为自定义。 然后下一步的三个钩选框中,只选择安装CUDA,不要其他两个(好像是驱动和物理加速程序)。 其次需要注意,在最后会提示已经安装和没有安装的VS版本。如果已经安装了VS2015和.Net framework4.5以上的,不用理会了。

c、需要手动修改path。右键打开我的电脑-->属性-->高级系统设置-->环境变量,可以看到系统中多了CUDA_PATH和CUDA_PATH_V8_0两个环境变量。接下来,还要手动添加以下几个环境变量:

CUDA_SDK_PATH = C:\ProgramData\NVIDIA Corporation\CUDA Samples\v8.0 

CUDA_LIB_PATH =C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\lib\x64 

CUDA_BIN_PATH = C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\bin 
CUDA_SDK_BIN_PATH = C:\ProgramData\NVIDIA Corporation\CUDA Samples\v8.0\bin\win64 
CUDA_SDK_LIB_PATH = C:\ProgramData\NVIDIA Corporation\CUDA Samples\v8.0\common\lib\x64 

然后再打开path,在最后增加以下路径:

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\lib\x64 

C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\bin 
C:\ProgramData\NVIDIA Corporation\CUDA Samples\v8.0\bin\win64 
C:\ProgramData\NVIDIA Corporation\CUDA Samples\v8.0\common\lib\x64 

然后重启电脑,CUDA安装完成。

d、验证安装是否成功:使用cmd命令行格式,CD到 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0目录下 找一下 extras\demo_suite 文件夹。里面提供了NVIDIA自带的两个测试.exe文件:deviceQuery.exe 和 bandwidthTest.exe 。 在命令行输入文件名(如bandwidthTest.exe),如果看到输出的最后result = pass 就说明安装成功! 恭喜你:)。 如果不是, 噢,只好检查下cuda安装中提示的信息,特别是系统兼容性和所需VS组件等。以及系统环境变量。 我在这里还是比较顺利的,细节可参见倾世纪兄弟的博文http://blog.csdn.net/lvfeiya/article/details/53325784 , 很有帮助,在此表示感谢!


4、安装cuDNN6.0。 这个比较简单,在下载压缩文件后,解压。 文件夹cuda下有三个目录:bin、lib和include,里面各有一个文件,把他们复制到CUDA的安装目录下(...\CUDA\V8.0\)的相同目录下即可。 以前在NVIDIA官网https://developer.nvidia.com/rdp/form/cudnn-download-survey 可以下载各cuDNN库,但最近好像不能用了。有需要可私信。


5、安装anaconda5.0.1.。 对应python3.6版本。这个没什么说的,就是注意在选项“advanced option”时,把第一项也钩选中“add anaconda to my PATH......”。


6、为pip和conda命令,创建国内升级镜像(我选的是清华)。否则默认路径下载速度慢的无法忍受且经常失败。 具体做法,打开anaconda Prompt, 

a、conda镜像,在命令行输入:

conda config --add channles https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/

conda config --set show_channel_urls yes

b、升级pip

python -m pip install --upgrade pip

c、设置pip镜像(不确定conda设置后是否还需要这么做,我又多设置了一次),将以下两条命令创建到一个pip.ini文件中,并在C: \用户\Administrater (或其他使用anaconda的user目录)下,创建目录pip,将pip.ini复制其下。

[global]
  index-url = https://pypi.tuna.tsinghua.edu.cn/simple


7、创建tensorflowgpu环境 ,并激活。 因为网上普遍反映比较稳定的版本是python3.5+tensorflow-gpu1.4 ,虽然tf官方文档支持python3.6,本人没尝试,如大家成功请告知升级。 因此需创建并激活python3.5环境,并将tensorflowgpu、opencv、tenserlayer、keras等其他工具安装在这个环境。 如使用spyder等编辑器,也需要在此环境重新安装后才可import tensorfolw。

a、为tensorflowgpu创建 python3.5环境

conda create -n tensorflow_gpu python=3.5

b、激活tensorflow_gpu环境(以后使用时都要先激活)

activate tesorflow_gpu


8、安装tensorflow-gpu

pip install tensorflow-gpu

默认会安装1.4版本。如果成功,会提示success。 如果不成功或其他原因可用 pip uninstalltensorflow-gpu命令卸载,或用 pip install tensorflow-gpu==1.3 等各式降低安装版本测试。  成功后可用命令python 切换到>>>的python命令行,进行import tensorflow as tf 测试。 注意,如使用spyder等编辑器,需在命令行的tensorflowgpu环境下,重新安装一次(pip install spyder)。 


9、安装keras、opencv、tensorlayer等

都是在tensorflow_gpu 环境进行安装。具体如下:

a、 keras可 直接pip install keras (如缺少scipy、matplotlib等都可同样安装)

b、OpenCV 如pip失败, 可手动寻找相应的WHL文件(http://www.lfd.uci.edu/~gohlke/pythonlibs/ ), 下载到本地,然后cd到相应目录,执行pip install

opencv_python-3.1.0-cp35-cp35m-win_amd64.whl 

c、tensorlayer 如果直接pip 失败, 可以用github相应项目手动更新

pip install git+https://github.com/zsdonghao/tensorlayer.git 或下载到本地安装。

这部分就不细说了,把gpu环境搭建好后应该都不是事儿。 希望写的这些对大家有帮助,发现错误请指正。




原创粉丝点击