英特尔 vs. AMD:谁家胶水用更好?

来源:互联网 发布:淘宝点聊天没反应 编辑:程序博客网 时间:2024/04/28 15:13

题图源于互联网,图文无关

编者注:本文为新至强(Skylake-SP)与服务器设计系列文章的第二篇。原本要由狒哥继续分析新至强家族中的特色产品和一些宣传误区,奈何他上周突然跑到张北去看建设中的阿里巴巴云计算数据中心二期工程,回来又要准备本周在2017可信云大会可信超融合分论坛上的演讲材料……幸好有献哥这篇干货文章顶上,以免跳票之虞。

牙膏厂和农企的新一代服务器处理器终于碰面了,在2017年7月盛夏,AMD和英特尔先后发布了新一代服务器处理器——代号“那不勒斯”的EPYC系列处理器(图上),和代号“SkyLake”的Xeon SP(Scalable Processor,可扩展处理器,图下)

同上几代处理器产品相比,英特尔使用全新的Mesh架构取代了贯穿四代至强E5/E7的双向环形总线架构,英特尔沿用多年的“制程-优化”(Tick-Tock)两步走战略也放慢步伐为三步走的“制程-架构-优化”, Xeon v3和Xeon v4都基于14nm工艺,架构也有了较大的升级。但是最新的一代Xeon家族处理器的命名方式都发生了改变,使用Xeon SP取代了原来的Xeon(遂有人玩笑说“原来我们以前使用的x86处理器都是不能扩展的啊”),Xeon SP系列处理器单颗最高提供28核心56线程,全面超越上一代至强处理器——包括面向高端的E7 v4(最高24核心48线程)。

AMD的EPYC则是全新服务器处理器家族,源于ZEN核心,单片CCX架构的Die最多提供8核16线程的计算能力,在一个封装下可以提供最多32核64线程的计算能力(最少2×4=8核心,然后以8核心的倍数扩展)。

服务器处理器对比表:

注:本文讨论的仅限旗舰处理器间的技术对比和分析

单看表格上罗列的参数,貌似这次AMD的EPYC在内核数量和I/O通道等方向全面压过了Xeon SP,而又没有面向4路及以上市场的意思……且慢下结论,咱们先看看这届服务器处理器谁家的胶水质量更好……

胶水一词源于当年英特尔和AMD的双核之争,将两个核封装在一个CPU里的形式被戏称为胶水双核。AMD显然“发扬光大”了这一技术不仅仅是双核,,上面那张AMD的32核EPYC处理器就是4个Die(每Die 8核)封装在一颗处理器里。

AMD的松饼胶水

既然AMD的照片那么抢眼,咱们就先说说AMD的EPYC吧。

全新的ZEN架构是EPYC的基础,在服务器处理器上,每颗Die都是一颗8核的处理器,四颗Die通过Infinity Fabric(就是下图的8字双环形高速通道)互联,因此顶配的EPYC 7601是一颗具有32核64线程的处理器,嗯,也许说它是一个片上(On-Chip)四路服务器会更合适。

EPYC就像题图右侧的松饼一样,四片拼成一个完整的处理器,每一片都提供8核16线程的计算能力,片与片之间的互联采用了Fabric技术,具有相当高的总带宽。

内部的Fabric带宽是42.6GB/s×4=170GB/s,而两颗处理器间的Fabric则占据了PCIe 3.0 x64的总线,总带宽约37.9GB/s ×4=152GB/s

看清楚了吗?在一颗处理器内,就像是一个8核 ×4=32核的小型四路服务器,内部的Fabric环形互联;而两颗处理器间的总线带宽略低,且产生的多核并行计算的跳转也要增加一倍,如果EPYC要支持四路处理器的话,处理器间的Fabric总线不但要降低一倍,而且跳转数也会增加一倍,因此,EPYC设计成为双路的是大有含义的(单路和双路的EPYC都提供128条PCIe 3.0通道)。

当然,双路的EPYC7601已经有64核128线程的计算能力,计算核心数量已经达到上一代英特尔四路服务器的中上水平了。

结论:这代AMD EPYC的胶水技术提升了,PCIe复用于Fabric的技术是个神来之笔。由于每片Die的核心最多只有8核,因此便于AMD控制和筛选良率,这对于没有自己晶圆厂的AMD来说,非常重要。

英特尔的三明治胶水

题图左侧的三明治就像这一代的英特尔处理器一样,它是一个分层的处理器,每一层都有着它独特的意义。

这张图是我们把一颗Xeon E5-2699 v4倒扣在Xeon SP 8180上拍的照片。从侧面看,Xeon SP大的多,散热的金属顶盖面积大了一倍有余,但是针脚PCB的厚度是一样的。同Xeon E5 v4一样,Xeon SP也是一个三明治的夹层结构,散热的金属顶盖下是Die,但是Die没有直接安装在针脚的PCB板上,而是通过一个过渡层板连接,也就是说,整个Xeon SP处理器是四层的结构——金属散热盖板+Die+中间层+针脚PCB。Xeon v4是第一代采用了这样结构的Xeon处理器(Xeon E5 v3的针脚PCB很厚,没有中间层),而Xeon SP更是发扬光大,针脚数上升到3647,如此多针脚大都用在6通道内存和48根PCIe 3.0上了

和AMD EPYC不同,英特尔的胶水没有用在Die上,而是把几层粘在了一起,形成立体化的3D结构——或者说,更像是三明治。硕大的体积也让顶配的Xeon SP 8180具有205W的TDP,较上一代E7-8890 v4的165W提升了40W之多。

除了处理器的4层结构,Xeon SP的安装也全面改进了,毕竟巴掌大的处理器再使用夹具式的安装方式难度有些大。

上图可以清晰的看出,Xeon SP 3647针脚的底座上有6个安装定位销,其中4个兼固定螺丝

处理器要先和散热器安装在一起。上面的是铜制散热器,支持205W TDP;中间黑色的是一个塑料夹具,需要先将Xeon SP安装在黑色的塑料夹具上,再与散热器合体

这是处理器安装在黑色塑料夹具上的样子

然后一体化的处理器+散热器可以直接通过定位销准确的安装在底座上,用4颗内六角螺丝固定,相比之前2011针脚的夹具式设计,这样的成本可能会高一些,但是用户损坏处理器的几率会更低。

总结:Xeon SP的多层三明治结构可以布置更多的针脚,分层的结构也有助于强化处理器顶盖的强度和散热效率(从网上得知Xeon系列处理器是钎焊散热)。Xeon SP具有了更高的TDP规格,也意味着可以容纳更多的核心,更高的主频。缺点就是太考验晶圆厂了,这么大的Mesh架构核心,良率始终是个问题。目前顶配的白金版Xeon  8180处理器出厂价高达10000美金,而上一代的E7-8890 v4才7000美金。

胶水可以横向粘,也可以垂直粘,那么谁家的胶水质量更好,效果更出色?还要等企事录随后的系列测试才知道,不过从目前的测试进度来看,这代英特尔的Xeon SP的亮点更多,至于AMD的EPYC,我们还没有途径拿到样机,希望不久的将来会有机会。

最后说个小花絮

在英特尔发布Xeon SP的时候,外厅摆放了各个服务器厂商的样机,为了展示各家的设计,机器都揭开了上盖,我在看H3C的样机的时候,听到有个用户问工作人员。

“听说Xeon SP的功耗多了很多,那么这样散热器能支持多少W的散热呢?”

我随口回答:“这样的散热器可以支持205W TDP。”

结果那个用户白了我一眼:“不可能,这个散热器太小了。”

后来在华为的展台前,我又听讲他问华为的工作人员:“你们这个服务器的散热片支持多少W的散热?”

我:……

从原来双路服务器145W处理器到205W的Xeon SP,散热器其实变化并不大,更大的处理器尺寸带来了更好的散热效果,在很多场合,大就是好的——但也是挑战,后续我们会专文分析各大服务器厂商如何解决随之而来的系统整体散热问题。

文末广告:7月26日北京国际会议中心2017可信云大会,可信超融合分论坛,狒哥代表企事录主持、演讲并参加对话环节,欢迎到场交流!