GPU之cuda+cudnn+tensorflow-gpu

来源:互联网 发布:2003w0rd软件下载 编辑:程序博客网 时间:2024/06/05 10:38

2017年8月14日
MIL day 35

今天总算是将github上一段关于densenet的200行的代码看完了,前前后后看了将近一个星期。其实一上手就开始看代码我是很慌的,python都没太看细,仅仅凭着对densenet的论文算法去看代码,一边看一边去help() tensorflow里的API接口定义,所以阅读代码的效率很低。以后再看代码得有针对性!

读完代码开始跑的时候,我是用的CPU,100个数据大概要跑七八分钟,算了一下,cifar-10大概要跑13天,问师兄怎么这么慢,“很正常啊,cpu,你可以用gpu跑,快很多”。于是一下午与cuda奋战,终于成功将cuda装好,然后tensorflow-gpu版本装好,成功在gpu上跑起来。
尽管能在gpu上简单跑一下,但是这只是简单的cifar-10数据集,而且只是简单的densenet结构,没有B没有C,而且我对tensorflow以及python还有很多模糊的地方,后面再继续加油吧!

安装cuda的坑

之前先安装cuda但是make失败,而且有一句“CUDA driver version is insufficient for CUDA runtime version”,百度之后,要卸载显卡驱动重新安装,自己也没有太好的办法,就卸载显卡驱动重装了,其实数据已经备份好了,卸载之后如果出问题就打算重装系统的,结果卸载后重新安装显卡驱动再去装cuda,make后pass了,激动!接着配置环境变量,nvcc -V出现如下:
这里写图片描述
这就算是配好了cuda; 然后复制粘贴一下文件,cudnn也配好了,完美啊! 现在代码正在开心的在gpu上跑呢!
关于cuda安装配置 点这里 重点还是要看NVIDIA官网,出insufficient问题了再看这个
关于显卡重装,可以看我之前的博客,点这里
关于后续cudnn配置,点这里
注意版本不同的话记得啊改一下版本号

注:先卸载tensorflow的cpu版本,然后安装cuda时有一句问是否安装显卡driver的,记住敲no,然后其他的默认就可以了,安装好会出现个比较醒目的summary,这时候cd /usr/local/cuda-8.0/samples/1_Utilities/deviceQuery 然后sudo make 再然后./deviceQuery 这时出现
这里写图片描述
看倒数第二行,result = pass,就算是cuda第一步,然后参考第一个链接配置环境变量,再source /etc/profile应用一下就可以,echo $PATH 查看环境变量是否搞好,nvcc -V查看cuda版本;接下来装cudnn,看上面,应该很快就好,最后sudo pip install tensorflow-gpu tensorflow的gpu版本应该就OK了!
接下来就可以应用了,跑程序时它会自己找gpu跑的


仔细想想,整体上其实是没有遇到太多坑的,不然这会估计在重装系统 #笑哭

有问题还是要biadu啊google啊!

阅读全文
0 0
原创粉丝点击