AMD EPYC服务器深度揭秘:32个核心堆一起真不容易!

如果说Ryzen在桌面上完美归来,为重塑公司和产品形象奠定了基础,那么今天发布的EPYC(霄龙)服务器平台,就是AMD全面扭转竞争态势的天王山战役。多年前,AMD因为各种原因离开了利润丰厚的、广阔的x86服务器市场,现在终于回来了!

EPYC服务器处理器和桌面、移动领域的Ryzen一样,都是基于全新的Zen架构,但是针对服务器、数据中心做了大量的针对性设计和优化,毕竟这些领域对于软硬件的要求都太高了。

AMD也毫不吝啬地公布了有关EPYC平台的大量细节,其中凝聚了众多工程师的心血,值得细细品味,当然很多细节技术性都比较强,我们也不会过多地深入,就带着大家大致了解一下。

【服务器版的Zen架构】

Zen架构在设计之初,就充分考虑了不同市场领域的适应性,桌面、移动、服务器(数据中心)都要靠这一套架构拿下,这和Intel近些年的理念也是类似的。

Zen微架构设计,EPYC、Ryzen是相通的,包括核心与缓存配置,AMD从数据中心应用角度做了重新梳理介绍,也可以参考我们此前的解析。

当然,Zen架构也有诸多面向服务器和数据中心的针对性设计,比如大数据负载、虚拟化增强、安全加密增强。

除了标准指令集,EPYC还增加了大量新的指令集,更好地优化数据中心应用,其中既有和Intel通用的,也有两条AMD独有的:CLZERO(清理缓存行)、PTE Coalescing(4K页表合并为32K)。

虚拟化方面也加入了不少新指令集,包括Data Poisoning内存错误处理、AVIC高级虚拟化中断控制器、Nested Virtualization嵌套虚拟化、SME安全内存加密、SEV安全加密虚拟化。

虚拟化延迟,可比推土机架构降低50%。

52% IPC(每时钟周期指令集)的架构性能提升,EPYC同样是适用的。

【数据中心优化】

EPYC的设计原则有四个方向,包括每路能力、Fabric互连、内存、IO,接下来都会涉及到。

AMD认为,现有的双路系统存在诸多局限,比如IO扩展有限、配合第二路CPU才能有完整IO、CPU间专用链接无法拥有其他IO、平台需要PCI-E切换和芯片组等。

EPYC重点改进了这些方面,无需PCI-E每双路系统就能提供多达128条PCI-E,整合芯片组为SoC单芯片设计,支持全新的Infinity Fabric互连。

即使是单路EPYC,扩展性依然充足,包括128条PCI-E、所有链接都能用于IO、四个IO Hub、完整支持PCI-E P2P。

EPYC每颗处理器都能提供128条PCI-E,单路系统中可全部用于外部IO,双路系统中各拿出64条用于两颗CPU互连,然后各有64条对外IO,总计还是128条。相比之下,Intel单路平台仅40条,双路也才80条。

EPYC集成了一套独立的安全子系统,整合的AMD安全协处理器(ARM Cortex-A5架构的32位控制器),运行于安全的系统/内核,可以确保固件数据等片外非易失性存储的安全,提供安全加密功能,并可实现硬件验证启动。

SME安全内存加密是基于硬件的,可以保护物理内存免受攻击,单个安全密钥,操作系统/虚拟器管理器可以自己选择需要需要加密的页面,而网络、存储、显卡等硬件设备可以无缝访问加密页面。

SEV安全加密虚拟化则可以保护虚拟机免受其他虚拟你、非法管理员、不信任虚拟机管理器的伤害,每个虚拟机和管理器都有独立的秘钥,彼此加密隔离,并与AMD现有的AMD-V虚拟化技术整合。

针对虚拟化,EPYC在二三级缓存、核心间延迟、缓存和内存拓扑方面都做了优化。

企业级的RAS(可靠性/可用性/可服务性)也是一应俱全。

Infinity Fabric总线串联起了EPYC系统的几乎所有部分,具备低延迟、可伸缩性、可扩展性等特点,并有SCF、SDF两层控制与管理结构,将处理器、显卡、加速器、内存等有机地结合起来。

SCF可以提供SoC和系统级的连接与控制,并提供安全增强、电源管理、远程管理等。

EPYC的有效内存带宽可以达到290GB/s,相比于Broadwell Xeon高出多达150%。

同时从单路到双路的性能扩展几乎完美,可以提升多达98%。

【IO与互连】

内存方面,EPYC每路支持八个DDR4通道,每通道最多两条,也就是每路可以搭配最多16条内存,包括RDIMM、LRDIMM、NVDIMM-N、3DS DIMM等各种类型,频率最高2667MHz,容量最高2TB

EPYC每颗内部都有四个独立内核,彼此之间如何通信是个大问题,这同样仰仗张Infinity Fabric,每两个内核之间都可以直连(共六条),双向带宽42GB/s,并且延迟很低(具体多少没说)。

而在两颗EPYC处理器之间,也有四条Infinity Fabric,每个内核与另一颗处理器内的配对内核相连(单个带宽38GB/s总计152GB/s),这样任意两个内核彼此通信,最多只需要两跳。

单路和双路EPYC都可以对外提供八个x16链接(总计128 PCI-E),能任意拆分组合,每链接双向带宽32GB/s,合计256GB/s,支持各种PCI-E特性并整合了SATA。

单路扩展性都能完胜Xeon。

EPYC是一个SoC单芯片设计,整合了芯片组(SCH),可提供平台时钟发生器、计时器、实时时钟、中断、UART、四个USB 3.0、两个SMBus、六个I2C、SPI、GPIO等等。

AMD很大方地公布了各处互连的带宽数据,不过延迟只是说很低,没有具体指标。

双路系统:64核心、4TB内存、128条PCI-E。

单路系统:32核心、2TB内存、128条PCI-E。

【电源管理】

在一套典型的双路服务器系统中,处理器的功耗占了整体的53%,当然是首要的优化对象,排第二的内存也只占14%。

EPYC集成了先进的电源管理系统,整个处理器内部遍布上千个传感器,32个核心都能以1毫秒的间隔实时调节状态。

全方位的功耗和温度监控,可以根据工作负载,实时适应性调整运行状态,尤其是频率,以确保不超过功耗限制。

精细的电压和频率控制,可以根据功耗分布,让处理器运行在最佳状态,活跃核心较少的时候可以自动提高频率。

我们知道,每颗处理器的体质都不一样,包括温度、漏电率等都会有差异,而有的环境需要在各种条件下保持性能一致,有的则要求始终发挥最高性能,为此EPYC可以在启动时选择任何一种运行状态。

EPYC的热设计功耗也是可以根据需要调节的,需要高性能的就加强,需要低功耗的就削弱一些,比如180W的最高可以到200W,最低则可以到165W。

服务器应用基本都可以让所有核心都跑起来,但此时无论负载高低,默认各个核心都会运行在高频率,造成浪费,AMD则加入了新的算法,可以根据负载程度动态优化,能效可提升最多10%。

EPYC虽然可以提供充裕的带宽,但并不是所有应用都需要全部带宽,EPYC就可以进行适应性调节,能将能效再提升最多8%。

EPYC每一个内部都有四个内核,总计32个核心,如何让它们平衡地运行在最佳状态,难度是极大的,AMD能针对每一个核心进行管控,避免不同核心负载失衡,并降低功耗。

结果呢,反正就是比Intel更高的性能、更低的功耗。

本文作者:上方文Q

来源:51CTO

时间: 2024-09-16 03:21:59

AMD EPYC服务器深度揭秘:32个核心堆一起真不容易!的相关文章

剿灭至强 AMD EPYC服务器CPU细节曝光

AMD此前宣布的EPYC服务器处理器即将在6月20日正式发布,目前外媒VideoCards已经将EPYC的具体参数规格等悉数放出.该系列处理器16核心起步,最多拥有32核心的版本,价格对应从400到4000美元不等. EPYC处理器将支持最高128条PCI-E 3.0,8通道DDR4内存,最高支持2TB的内存.而根据SPEC 2006的性能测试,AMD的EPYC处理器和同等定位的Intel Xeon处理器相比较的话,性能领先幅度从20%起步,最高端的EPYC 7601领先幅度达到了47%. 本文

走进Epyc中心:AMD Zen服务器CPU技术规格与价格正式披露

AMD公司的Epyc处理器官方阵容已经正式公布,其将与长久以来统治数据中心领域的英特尔旗下至强处理器家族展开一场捉对厮杀. Epyc为AMD公司发布的服务器级处理器家族,与专门面向台式机与笔记本平台的Ryzen芯片相对应.全新AMD芯片皆立足AMD x86 Zen微架构打造而成的Ryzen与Epyc. 这会是AMD公司扳回一城的转折吗?其又能否帮助AMD打破英特尔公司的垄断地位?关于这些问题,我们将在后文中进行逐一探讨.作为文章的起始,我们首先路过这些疑问,聊聊其技术规格:此次发布的Epyc处理

AMD透露Epyc服务器芯片更多细节 多方面挑战英特尔至强平台

在 2017 年 AMD 财务分析师日活动上,AMD 一口气宣布了 VEGA 专业显卡.Ryzen APU.以及全新 Epyc 服务器 CPU 品牌.不过现在,该公司又释出了有关 32 核 Naples 服务器芯片的更多细节.其由 8 核 Zen 单元组成,可连接 8 通道内存,并且拥有 128 条 PCIe 3.0 链路.从规格山过来看 Epyc 服务器芯片已经相当诱人,不过对于数据中心管理员们来说,其真实性能到底如何?AMD 又打算怎么把它们安装到机架上? 事实证明,AMD 并不打算拿 Ep

AMD重回服务器市场,发EPYC霄龙数据中心处理器

AMD重回服务器市场,发EPYC霄龙数据中心处理器6月21日消息,AMD公司今日发布AMD EPYC(霄龙)7000系列数据中心处理器.AMD EPYC采用创记录的创新设计,搭载最多32颗高性能Zen核心,在整数运算.浮点运算.内存带宽.I/O基准和负载等方面较为领先. AMD总裁兼首席执行官苏姿丰(Lisa Su)表示:"凭借EPYC系列处理器,AMD在关键的企业级.云服务和机器智能负载等方面带来了业内领先的性能.EPYC处理器能够提供不妥协的单插槽系统性能,同时还能将双插槽服务器性能推向新高

英特尔推出新的Skylake 迎击AMD Epyc

英特尔声称,旗下的Skylake服务器处理器比上代Broadwell芯片的性能提升了65%.据悉,新的至强可扩展(Xeon Scalable)系列顶级版本的性能超越了AMD最近发布的Epyc CPU(中央处理器),但其I/O则不如Epyc CPU的充足. 结果表明,英特尔在数据中心方面仍保持统治地位,并无任何威胁.不过,预计AMD的Epyc和新兴的高通基于ARM服务器芯片及其他产品亦将在广泛而多样化的云计算领域中占据一席之地. Skylake白金8180和8160版本在性能/瓦特比(Perfor

深度揭秘Xshell后门事件:入侵感染供应链软件的大规模定向攻击

本文讲的是深度揭秘Xshell后门事件:入侵感染供应链软件的大规模定向攻击,近日,NetSarang旗下的Xmanager.Xshell.Xftp和Xlpd等在全球流行使用的服务器远程管理软件曝出被多家杀毒软件报毒查杀的情况,经过360科技集团追日团队调查分析确认,NetSarang旗下多款软件的关键模块被植入了高级后门,这是一起入侵感染供应链软件的大规模攻击事件,我们将其命名为"XshellGhost"(xshell幽灵). 事件时间轴 2017年7月17日,NetSarang公司发

AMD未来服务器战略皓龙4000和6000系列处理器

虽然经历了全球性的http://www.aliyun.com/zixun/aggregation/37831.html">经济危机,2009年仍是AMD服务器处理器新品迭出的一年.今年6月,AMD推出了代号"伊斯坦布尔"的首款六核心皓龙处理器,除了核心数量的增加,六核皓龙采用了45纳米工艺,并在虚拟化.能耗控制等方面进行增强,每瓦特性能有了明显的提升. 随着六核皓龙的发布,AMD在7月紧跟着推出了功耗55W的六核皓龙HE处理器,在8月又推出了功耗仅40W的六核皓龙EE处

游戏安全资讯精选 2017年第十九期:WebLogic Server WLS组件漏洞入侵挖矿事件分析,苹果手游代充灰色产业深度揭秘,《绝地求生》99%外挂都来自国内

[游戏行业安全动态]苹果手游代充灰色产业深度揭秘 概要:苹果手游代充最早可以追溯到2012年前后,到现在已经经历了多次发展,从最开始的外币汇率差,退款,36漏洞,再到现在黑卡,盗刷信用卡,甚至出现了专门的库存系统.库存系统保存的就是苹果的消费凭据,充值商家等到有客户时候,可以随时使用,可谓完美绕过苹果风控,使黑卡和盗刷可以大规模实现,让供货和销售分开,降低了行业进入的门槛,更加细分了产业链,放大了黑卡和盗刷的影响.库存系统还能绕过大多数游戏的外币检测,甚至充值游戏里已经下架的面值,比如之前某款游

深度揭秘:黑客是怎么入侵用户设备的?

本文讲的是深度揭秘:黑客是怎么入侵用户设备的?, 想要诱骗消费者和企业,最有效的策略并不一定非要多复杂.黑客们在窃取资金.数据以及访问企业系统时并不一定需要什么先进的技术,他们的动机大体上可以分为两种:机会主义和针对性攻击. Bishop Fox安全事务负责人Rob Ragan主要使用上述两种动机来区分网络犯罪行为,他表示, 攻击者并不关心受害者是谁,他们希望访问任何可以被盗用的设备,这对于他们而言只是一个数字游戏. 而有针对性的攻击则有所不同,因为威胁行为者出于特定的原因只想要访问特定的设备.