美国采购网DealABC_工业品给世界动力,艺术品给世界温暖

 找回密码
 立即注册

AMD EPYC 7000系列架构非-CE或EE评测

2017-5-11 17:37| 发布者: dealabc_admin| 查看: 368| 评论: 0

摘要: AMD EPYC 7000系列架构非-CE或EE评测 随着AMD EPYC的推出,我们终于可以深入了解AMD代号“Naples”的架构。CPU设计非常密集。绝大多数使用和购买服务器处理器的人不需要确切地了解每个架构是如何工作的。同样地, ...
AMD EPYC 7000系列架构非-CE或EE评测



随着AMD EPYC的推出,我们终于可以深入了解AMD代号“Naples”的架构。CPU设计非常密集。绝大多数使用和购买服务器处理器的人不需要确切地了解每个架构是如何工作的。同样地,那些使用服务器处理器的人通常只是想知道它是否正常工作的,或者是否需要很痛苦的每个回合都需要手工编译一段代码。
当我们将AMD EPYC架构作为我们要推出评测内容的系列时,我们意识到很少有人能够关注架构的复杂性。在2012年第一季度英特尔首次发布Xeon E5系列之前,服务器市场大部分仍处在一个单一架构的世界。随着AMD EPYC推出,现在市场上有另外的选择,它几乎可运行每一种软件。与此同时,这是一个相当激进的设计,与因特尔所提供的代际节奏不同,所以我们想为那些没有专门从事计算机工程或电子工程的人提供一个架构的概述。
在这篇文章中,我们将关注核心和互连。我们还有一个关于AMD EPYC 7000系列平台级性能的文章。这两个方面都对其价值有重大的影响,EPYC在数据中心的实际经验表现,我们可以分享一些独特的见解。

介绍AMD EPYC 7000系列的ZEN架构
AMD EPYC 7000系列是基于我们在Ryzen上看到的ZEN微架构。在进入服务器特征的详细信息之前,我们将快速回顾一下Zen。下面是微架构的概述:

每个核心能处理每个核心的两个线程。我们看到像POWER和Cavium ThunderX2 这样的架构在最近的空间中超出每个线程的两个核心。主流的Intel服务器在一个叫做超线程的特性中也是每个核心两个线程。AMD使用SMT,您可以从概念上考虑SMT和HT是类似的特性。

除了基本的核心架构外,CPU是由CCX的复合体构成的。CCX复合体是与我们的核心,L1、L2和L3高速缓存相互关联的。在AMD的架构上最好的性能是当工作负载适合这些CCX复合体的时候。

虽然AMD说它有四个核心,但如果每个物理芯片上的芯数少于8个(例如8、16和24核心EPYC 7000系列模型和Ryzen3/5系列),一些核心和潜在的缓存会被禁用。
在缓存中,AMD的设计是每个核心512KB的L2缓存,带有8MB的L3缓存的CCX复合体。这就意味着AMD的体系结构需要大量的缓存。

AMD Ryzen芯片一个8核心的模具带有两个CCX复合体(左边和右边板块可以看到):


每个模具多达有8个核心和16个线程带有4MB的L2缓存和16MB的L3缓存。然后,AMD将这些(最多8个核心)构建摸块,将其放到四个包块中。

每包块用有4个小模具可以让AMD保持低的制造成本,同时每个插口提供32个核心/64个线程,16MB L2缓存和64MB L3缓存。每个模具有一个双通道内存控制器,可进行2次DPC操作。不像台式机部件,每个模具都可以处理128GB的LRDIMMs,因此16x128GB的插槽,内存槽可以达到2TB或4TB的双槽设计.


该设计意味着在每个存储槽四个NUMA节点或双插槽设计中有八个NUMA节点上。您可以在Linux中看到这一点(这里有一个Ubuntu 17.04lscpu输出):

您同样可以在Windows中看到8个NUMA节点:


这实际上意味着将有不同的内存延迟,这取决于哪个模具需要从内存中读取数据,这些数据可以连接到那个模具上或者其他模具的结构。

AMD EPYC Infinity Fabric

为了管理这种复杂性并将数据移到每一块硅片上,AMD使用Infinity Fabric的架构。在一个特定的封装中,Infinity Fabric将不同的die连在一起:

如果你想对比一下英特尔的电流环结构和下一代Skylake SP的网格结构,我们也做一个。最关键的区别是AMD需要模具不再在同一个插槽上,而英特尔只停留在一块硅片上。

移动插槽观察,每个模具与第二个插槽上的一个模具相类似。

实际上,这意味着数据传输Socket 0 Core 0可以直接连的Socket 0 Core 3,如果连接到Socket1 Core 3需要用Fabric跳两级。
在Fabric的带宽方面,就是AMD公司提出的带宽特性。

这里有几个主要的警告。首先,这种Fabric是有存储速率的。如果你使用的是DDR4-2400或DDR4-2133将有Fabric速度的影响,与在双路系统中用8X NUMA节点的影响一样重要。其次,Infinity Fabric可以连接一切PCIe-PCIE、DRAMSATA存储,L3缓存数据。
Infinity Fabric本身就是工程学上的壮举。它有助于AMD大大降低制造成本。另一方面,它意味着当你从off-die进入Fabric时代,性能也有很大的变化。在不久的将来,我们将更全面地探讨这一领域。



【返利网站】返利额度最高的海外购物返利网站Topcashback:平均返利7~10%,注册就送$10点我注册

鲜花

握手

雷人

路过

鸡蛋

相关阅读

关于我们|Archiver|手机版|小黑屋|美国采购网DealABC_工业品给世界动力,艺术品给世界温暖  

GMT+8, 2024-7-2 00:55 , Processed in 0.117000 second(s), 8 queries , Gzip On, Apc On.

Powered by Discuz! X3.1

© 2014-2016 Sky-Express Inc.

返回顶部