AMD|奇妙的96核心、12通道DDR5!AMD Zen4 EPYC架构揭秘

近日,AMD正式发布了代号“Genoa”(热那亚)的第四代霄龙EPYC 9004系列处理器,面向服务器、数据中心、高性能计算、人工智能等领域 。
此前,我们已经介绍了EPYC 9004系列的型号规格、整体特性、性能能效,但是关于它,还有很多层次的东西可以挖掘,包括架构、SoC、内存、小芯片、CXL等等 。
今天,我们就来仔细说道说道 。
AMD|奇妙的96核心、12通道DDR5!AMD Zen4 EPYC架构揭秘
文章图片

一、Zen4架构
EPYC 9004系列基于和桌面锐龙7000系列同款的Zen4架构,只是针对服务器与数据中心应用做了适当的调整优化 。
AMD|奇妙的96核心、12通道DDR5!AMD Zen4 EPYC架构揭秘
文章图片

整体而言,综合计算33种不同的服务器负载,Zen4架构的IPC相比Zen3提升了大约14%,这比锐龙7000系列的提升高了1个百分点 。
不同模块的贡献差不多,最大的还是前端部分,接下来是载入/存储、分支预测、执行引擎、二级缓存 。
AMD|奇妙的96核心、12通道DDR5!AMD Zen4 EPYC架构揭秘
文章图片

AMD|奇妙的96核心、12通道DDR5!AMD Zen4 EPYC架构揭秘
文章图片

架构总览,以及与Zen3的变化细节对比,都和桌面版Zen4几乎毫无二致 。这里也就不再赘述了,感兴趣的可以参考我之前的解析 。
AMD|奇妙的96核心、12通道DDR5!AMD Zen4 EPYC架构揭秘
文章图片

AMD|奇妙的96核心、12通道DDR5!AMD Zen4 EPYC架构揭秘
文章图片

AVX-512指令集其实也是一模一样的,但它在服务器数据中心显然更加如鱼得水,作用更加明显 。
根据AMD提供的数字,双路96核心新旗舰EPYC 9654对比双路64核心老旗舰EPYC 7763,得益于规格性能的改进,尤其是AVX-512指令集的加持,NLP吞吐量、物体检测吞吐量、图像识别吞吐量分别增加了大约4.2倍、3.5倍、3倍之多!
AMD|奇妙的96核心、12通道DDR5!AMD Zen4 EPYC架构揭秘
文章图片

安全方面也更丰富,其中安全加密虚拟化(SEV)方面,除了继续支持SME、SEVES、SEV-SNP,还将内存加密升级到AES-256-XTS,并支持1006个加密客户机,支持多重主机密钥(SMKE) 。
另外强化了对客户机的保护,尤其是可免于SMT攻击 。
二、SoC总览
AMD|奇妙的96核心、12通道DDR5!AMD Zen4 EPYC架构揭秘
文章图片

这是EPYC 9004系列额整体布局图、核心特性 。
这一代依然没有独立芯片组,而是一个完整的SoC,延续chiplet小芯片设计,内部包含一个IOD、最多12个CCD 。
CCD每个集成8颗Zen4 CPU核心、32MB三级缓存,合计最多96核心、384MB三级缓存,同时也有8个CCD、4个CCD的版本,分别最多64核心、32核心 。
IOD内集成了DDR5内存控制器、PCIe 5.0/CXL 1.1+控制器、第三代Infinity Fabric控制器、安全处理器 。
内存为12通道,最高频率4800MHz 。PCIe 5.0可提供128条 。这两部分后边细说 。
封装接口改为新的SP5,尺寸增加到约75×72毫米 。
AMD|奇妙的96核心、12通道DDR5!AMD Zen4 EPYC架构揭秘
文章图片

单路配置下,EPYC 9004系列可搭配最多24条DDR5内存,每通道2条(2DPC),可提供128条PCIe 5.0、8条PCIe 3.0通道 。