显卡|AMD Radeon RX 6950 XT 天梯榜首发评测:新显存,新旗舰( 二 )



Radeon RX 6950 XT和RX 6900 XT相比 , TBP从原来的300W提升到了335W , Boost频率从2250MHz提升到了2310MHz , 游戏频率则从2015MHz提升到了2100MHz , 显存等效数据频率从16Gbps提升到了18Gbps , 显存带宽从512GB/s增至576GB/s , 大家可以把RX 6950 XT看作RX 6900 XT的官方超频版 , 显卡的建议零售价是8399元 , 仅比原来的7999元增加了400元 。
RDNA 2架构解析:更快频率、更高能耗比、更强性能RDNA 2架构三大改进点:
· 高频率设计:RDNA 2架构相比RDNA 1架构实现了同功耗下30%的MAX频率提升;
· 无限缓存设计:可以消除带宽瓶颈 , 极大提升了等效带宽并降低功耗 , 有助于提升能耗比;
· 支持DX12U、DS API:紧随时代潮流 , 让A卡支持光追等高级API特性 。
RDNA 2架构是一个强大的游戏架构 , 它这次相比RDNA 1代架构主要有三个大改进 。 首先AMD在RDNA 2上实现了突破性的高频率设计 , 在拥有高频率的同时维持较好的能耗表现 。 其次AMD专门为RDNA 2研发了革命性的AMD Infinity Cache无限缓存技术 , 无限缓存在提供非常可观的等效带宽的同时还更节能 , 能耗表现更上一层楼 。 第三个改进点就是支持了DX12 Ultimate的高级特性 , 包括DXR、DirectStorage等API , 让AMD的显卡也加入到支持DX12 Ultimate的大家族中 。
改进1:唯快不破 , RDNA 2架构主打高频设计
先来看频率改进 , RDNA 2实现了突破性的高频率设计 , 虽然与RDNA都是相同的7nm制程工艺但是进步巨大 。 通过这张图表我们可以看到 , 以每个计算单元CU为例RDNA 2架构实现了相同功耗30%的频率提升 , 而如果是相同的频率则功耗只有RDNA的一半还少一些 , 也就是能耗比提升50%以上 。
改进2:消除带宽瓶颈 , 引入“Infinity Cache”技术
RDNA 2的成功源自于RDNA 1的研发经验 , 在RDNA 1代架构上AMD在两组CU单元组成的Dual Compute Unit中添加了L0级缓存 , 全新设计的L1缓存及减少拥塞的4MB共享L2缓存 , 让RDNA架构提升了缓存带宽、减少了缓存的延迟及功耗 。 最终通过256-bit位宽14Gb/s显存速率的GDDR6显存达到了448GB/S的显卡带宽 , 看起来还是很不错的 。
只不过这样的带宽对于RDNA 2来说还不够 , AMD发明了全新的无限缓存技术 。 这项技术的实现多亏了CPU部门的研发经验 , AMD解决思路其实就是把原本用于EPYC霄龙服务器处理器上的高密度SRAM专门为GPU加以优化 并且为其加上AMD在Zen架构上大获成功的“Infinity Fabric”无限总线 两者合二为一就成为了“Infinity Cache”无限缓存这个新一代带宽利器 。
RDNA 2通过“无限缓存”大带宽 , 低功耗的帮助实现了IPC的提升、同时提高工作频率 , 完成每个时钟指令的功耗也下降明显 。 把三项提升综合到一起 , 就可以让RDNA 2架构在RDNA 1架构的基础上能耗比继续大幅度提升 , 多达54% 。
改进3:紧随时代潮流 , 全面支持DX12U、DS API
我们再来看RDNA 2架构上第三个改进点 , 支持更多的高级特性 。 AMD在RDNA 2上终于全面支持了DirectX 12 Ultimate、DirectStorage API等高级特性 , 让A卡也可以使用诸如DirectX光线追踪、可变速率着色、网格着色器、采样器反馈等技术 。
·光线加速器 Ray Accelerator
实时光线追踪是一个能让游戏画面更真实、提高玩家沉浸感的重要技术 。 实时光线追踪最大的缺点就是对显卡的计算能力要求极高 , 传统的CU单元运行实时光线追踪的效率非常低 , 为了让实时光线追踪的画面更为流畅 , AMD在RDNA 2架构的每一个CU计算单元里都放入了一个\"Ray Accelerator\"光线加速器 ,CU计算单元越多 , RDNA 2架构显卡的实时光线追踪性能就越强大 。