如何配置一台适用于深度学习的工作站?

刚买两块Titan Z GPU准备搞搞深度学习,结果原来的工作站功率不够,带不动,所以准备组装一台新工作站。求大神们给点意见,最好给个完整的list,我好照着买,谢谢。(本人新手,也不怎么会组装,最好是半成品机器,然后我组装一下就好的那种)
关注者
3815
被浏览
449158

51 个回答

学习机器学习相关的算法和演练流行的平台或框架,不需要特别强大的设备

所以对深度学习而言,基本的需求则是:

内存大于:8G

一片以上带CUDA单元的显卡。

操作系统:win7/8/10/ubuntu/OSX皆可


这对大多数人来说都不难,如果手上的电脑没超过五年,简单的升级一下自己手上的电脑即可。

一般就三步:

1.加显卡: 1050ti 4G<省钱,入门>,1070ti<性价比最高,价格还不错>,高端可选1080ti。

2017Q3主流显卡性价对比

勿买3G显存版本,好多CNN的sample 都跑不起来。买个大厂的公版即可,没必要买那些超频的版本。

2.加内存: 买来插上即可/当然,有个SSD硬盘效果更佳。

3.换电源:单显卡>400W,双显卡>700W。

基本来说这样就足够了。


最近intel的新处理器8xxx出来了,ryzen1700和i7 8700价格和性能都差不多的情况下,还是首选intel的吧.

对于3-8卡的场景,大多不缺钱,价格似乎也不要紧。省钱的攻略内容不适用,有钱的随意即可。



软件部分:

最近TensorFlow也支持了windows的GPU加速。似乎这个障碍也不存在了。

对Windows端的py编辑,比较推荐pycharm或则是VS Code.

PyTorch用到了S3的存储,因此有一个能出墙的小工具也是必要的。


破除几个误区:

1.所谓深度学习机器:没有这种特殊的机器,有带CUDA显卡的机器就是可以拿来学深度学习的,在售的多数所谓的科学计算机只是CPU和显卡比较多而已(超算机和类似TPU的专用平台不在讨论之列)。

2.为了深度学习组专用平台: 没有这个必要,只是学习的话,随便找个电脑加一片显卡即可。

3.深度学习是不是要特别高的配置:我见过有个兄弟用笔记本(MBP)玩RCNN也玩得很high。

x299配置:

2路GPU配置单:

四路GPU配置单:

(1080ti换成Titan也没问题)
ps:某东这是要给推广费了吧

GPU的选择是重点

GPU的选择:

GTX

下面给出1080、1070、1060、Titan X、Titan X 2016的几项指标的对比:

TFLOPS(teraFLOPS FLoating-point Operations Per Second每秒浮点运算次数)

1080ti 真是牛B,11.5TFLOPS,11GB显存

VRAM (显存)

CUDA Cores

以上几幅图转自:GTX Titan X comparison

一般消费级主板虽然有四个x16规格的插槽,但是当你插上四路GPU时,事实上每路只有x8,所以这其实没有最大化四路GPU的性能。
CPU和主板:
其中一个制约因素:单U的max PCI-E lanes。单U最大40lanes(即使服务器的CPU),也就是即使有4个规格的x16,只能最多达到2路x16加一路x8。不过,芯片组其实也可以扩充一部分lanes。(x99可以扩宽2.0的8lanes,z170可以扩充3.0的20lanes)
有些主板上会搭载PLX chips,这个芯片是相当于是“交换机”的功能,并没有增加额外的lanes。明确提出搭载PLX的是华擎X99 WS-E/10G。

内存、电源、硬盘、机箱等:
至于,内存、电源、硬盘什么的,就比较容易了,根据自己预算,自行权衡,内存建议DDR4 64G,CPU不可太差不然会是瓶颈,机箱的话海盗船的都还不错。电源其实还是要买个比较稳定的,因为会有“无休止”的training。








x299

新旧Titan对比: