AMD|小芯片构架的RDNA 3主打差异化竞争——解读AMD次世代GPU的战略底气( 二 )


在此次发布会中 , 我们的老朋友——AMD Radeon技术事业部工程研发高级副总裁王启尚先生作为主讲人 , 重点解决了新发布的产品特点 。 志不强者智不达!作为AMD树立次世代显示核心标杆的RDNA 3构架 , 在设计之初便设定了三个前瞻性目标:

追求在每瓦性能方面的领先地位 , 使游戏玩家能够合理地提升它们的性能;
支持更快、更高分辨率的新一代的显示器;
通过AMD全新的软件功能和解决方案 , 来提供新一代的游戏体验

可以看到 , AMD的新一代GPU产品不再以纯粹堆砌晶体管数量 , 或者说单一的性能指标作为衡量GPU进步的指标 , 这也是充分发发挥构架优势和工艺制程带来的产品目标改变——体现在RNDA 3上 , 新构架实现了54%的每瓦性能(能耗比)的提升 。 而且这一理念并非是RNDA 3就做出的改变 , 其实在AMD的前三代产品:从Vega到RDNA , 从RDNA到RDNA 2 , 均非常看重每瓦性能指标的提升——从Vega到RDNA 3 , 三代产品总共实现了超过350%的累计的提升 。
除了每瓦性能指标外 , 另两在提升表现在GPU输出的显示能力、软件功能和整体解决方案之上:近年来显示设备的的硬件也处于高速增长中 , GPU必须拥有超前的输出能力的匹配能力;不仅如此 , 在GPU的市场竞争中 , 单一的硬件性能已经不再是决定成败的惟一因素 , 软硬结合才是提供出色用户体验的关键 。 在过去数年中 , AMD不断推出并更新软件和整体方案层面的软实力 , 诸如AMD超威卓越平台、AMD FSR 2.0等新技术纷纷加入到GPU平台之中 , 提供了优秀的整体用户体验 。
首次将小芯片架构引入到GPU之中

聊完RDNA 3构架的设计目标 , 我们再来看看该构架的具体创新 。

RDNA 3构架最为重要的创新便是采用了Chiplet(以下简称“小芯片”)的架构 , 这个构架其实我们并不陌生 , 此前在锐龙跟EPYC(霄龙)产品线上均采用了同类技术 , 只不过RDNA 3是首次采用该构架的GPU 。 小芯片架构的原理说来并不复杂 , 它是将不同的制程工艺应用在GPU的不同功能区间上:针对核心运算的引擎采用的是5nm制程工艺 , 被称为GCD , 可实现更为出色的每瓦性能;GDDR 6显存接口则采用相对成熟的6nm的制程工艺打造 , 被称为MCD , 值得注意的是 , MCD中加入了第二代的高速缓存Infinity Cache技术 。

进一步打开RDNA 3构架 , 可以看到GPU共拥有一个GCD和6个MCD组成 , 在DIE上 , GCD的面积为300mm2 , 而单个MCD的面积为37mm2 , 这样的设计不仅能够降低成本 , 也能提升DIE上的利用率 。 正是通过小芯片架构 , RDNA 3构架GPU可拥有高达580亿个晶体管 。
GCD核心进步1:统一的计算单元

作为显示核心的GCD , 由三个全新的单元组成:统一的计算单元、新的显示引擎和新的双媒体引擎(Dual Media Engine) 。 可以留意到 , AMD这次定义RDNA 3构架的计算单元前加上了一个定语——“统一” , 什么叫统计的计算呢?可以理解为一个高度紧密集成的单元 , 也就是在图形渲染时 , 在人工智能和光线追踪之间共享计算资源 , 以提升更高的DIE上单位面积性能比 。 实现资源共享的关键在于通用的寄存器 , AMD称之为VGPR 。 RDNA 3构架的VGPR比RDNA 2构架多50% , 能充分利用5nm制程带来的优势 , 进一步封装出更多的晶体管 , 使得晶体管密度增加了165% 。 这样的芯片设计也带来了体积更小、速度更快、更节能的新构架 。

在RDNA 3构架的GCD中 , 采用了全新的Stream Processor流处理器 , 这也是GPU显示核心中最基础的运算单元 。 新构架的流处理器采用了双路的Dual Issue指令分发单元 , 可以向Wave 32的 SIMD Unit发出两路不同的指令 , 这意味着 , 除了数据可以并行使用(RDNA 2功能) , 指令传达也可以双路并行 , 这大大提升了计算单元中的运行效率 , 也更加节省能耗 。