移动高性能深度学习机器+娱乐终端=准系统+Ubuntu To Go(SSD)

来源:互联网 发布:java异步日志 编辑:程序博客网 时间:2024/05/01 01:14


本文提供了一种可以在笔记本电脑上使用GPU完成需要高性能计算的深度学习,游戏等功能的解决方案。

首先这里的笔记本实际上指的是准系统笔记本,可以百度搜索准系统了解基本介绍,也可以到准系统吧进一步的深入了解和与相关专业高手交流。

准系统实际上指的是高性能笔记本的模具(类似于alienware,地球人,未来人),通过卖家的DIY组装配置,最后买家可以以较为低廉的价格获得性能极高的笔记本。

缺点是:

  1. 使用机器的风险,毕竟是小众的东西,保修售后什么的可能不如正牌笔记本(尽管硬件是一样的,所以质量应该也还好)。
  2. 还有就是需要自己配置的东西很多,特别是驱动什么的。


购置机器

准系统笔记本可以从淘宝进行购买,作者是从名叫叔叔左左的淘宝卖家进行购买的。

配置为GTX1070 + I7-7700k + p770m2 + 2*海盗船DDR4 16G 2400mhz + 512GSM961 SSD + 17寸1080p屏幕(可以根据自己的需求更改配置,调整价格)


这个价格和台式机比怎么样,这个只能因人而异了,但是根据市场价格来算的话,

GTX1070的3300 + I7-7700k的2799 + z270主板的2500 + 两根海盗船16GDDR4内存的1800 + 512GSM961的1500 + 其他配件的300,一共11900,若再加上2000元价格的显示屏的话,也要13900,因此算起来其实不会差太多。然而最重要的是,我们配的可是笔记本啊,是可以装在包里的笔记本啊(虽然有点笨重,6.5kg),但总算是可以带身上的。


准系统到手后,就可以开始折腾了。一般都会随机安装好windows系统,开机就可以进入。

进入后,可以先安装些大型游戏,运行看看是否能正常工作,然后用一些硬件检测工具,看看硬件情况,做一些benchmarking,这里不再赘述。


在移动硬盘中安装Ubuntu系统

准系统的部分到这里就完成了。

接下来的部分是Ubuntu To Go的步骤,即如何将ubuntu系统安装在一个移动SSD硬盘上,并从USB接口启动Ubuntu,安装GPU的驱动程序,并在Ubuntu中进行深度学习以及其他高性能计算工作(GPU相关的)。


在ssd中安装ubuntu的步骤和普通的装系统一样,制作一个u盘启动盘,然后同时将u盘和要安装ubuntu的移动硬盘,通过USB接口和准系统连接在一起。

开机选择u盘作为启动项,开始安装系统。

完成之后,选择ubuntu作为启动项,进入系统。


安装显卡驱动和CUDA(深度学习环境)

进入系统后,你可能就会发现有点奇怪了,至少我的机子出现了一点异常:屏幕闪屏整个系统也出现卡顿,估计是显卡驱动问题,因为准系统屏蔽了cpu的集显(事实上,当我们完成了安装后,检查机器的显卡信息,会发现只有一张显卡,那就是独显,所以应该是准系统屏蔽了集显),而独显又没有驱动,因此显示的相关计算任务都放在了CPU上(不是集显,集显被屏蔽了),当然这只是我的猜测。

不过我们可以ctrl + alt + F1~F6进入tty,tty不会卡。在tty中,我们就可以正常的安装驱动和cuda了。

如果只是安装驱动的话,可以参考 https://gist.github.com/dangbiao1991/7825db1d17df9231f4101f034ecd5a2b

如果要装cuda的话,还需要从官网下载对应的版本 https://developer.nvidia.com/cuda-downloads

需要注意的是,安装驱动需要把使用 sudo service lightdm stop,sudo killall X* 把所有使用显卡驱动的进程关闭。

而cuda在安装中,除了执行 sudo bash cuda_8_46.run 外,还需要注意,cuda内附驱动,可以用也可以自己安装,如果是自己已经安装了大于cuda内版本的驱动,就不需要安装cuda的驱动。但如果已安装的版本要低于cuda版本的话,cuda是无法工作的,必须要用大于等于cuda驱动版本的驱动才可以


Benchmarking结果

在这台GTX1070 + I7-7700k + ubuntu16.04的准系统中,我们进行了CPU和GPU的测试。

CPU测试用的是sysbench,分别在准系统和一台装有ubuntu15.04的台式电脑(配置如下图)执行以下命令

sysbench --test=cpu --num-threads=1 --cpu-max-prime=10000 run

得到以下的结果:



准系统跑了6.9秒,台式机跑了8.5秒,速度之比为 (10000/0.69) / (10000/0.85) = 1.24,和理论的速度比4.2Ghz/3.3Ghz = 1.27相差无几。


GPU的测试采用的是tensorflow的benchmark,详情请看这个链接 点击打开链接


alexnet的benchmark的结果是平均0.032s,也就是32ms,比Titan X快了一倍。

另外的cifar10实验,也达到了平均1923 Examples/sec,估计应该是强大的7770k起的作用。

1 0
原创粉丝点击