AMD|AMD首发 GPU正式进入Chiplet时代!( 二 )


Navi 31:重新设计的 CU 和更好的光线追踪
说到时钟速度 , Navi 31 是多年来第一款针对着色器处理器(即 ROP 和纹理单元以及芯片的其他部分)具有不同时钟速率的图形处理器 。着色器处理器的工作时钟略低于芯片的其余部分 。
目前最强版本的Navi 31图形芯片(RX 7900 XTX)的GCD代码共有96个CU(计算单元)单元 , 同样数量的光线追踪单元 , 6144个着色器处理器和192个ROP单元 。
与其前身 Navi 21 相比 , AMD 对 Navi 31 图形处理器中的计算单元 (CU) 进行了重大重新设计和改进 。AMD 表示 , Navi 31 芯片中的 CU 在相同的运行时钟下将 IPC 提高了 17.4% 。
AMD|AMD首发 GPU正式进入Chiplet时代!
文章图片

此外 , 关键的创新是现在 FP32 单元可以同时执行两个操作 , AMD 称之为 Dual Issue SIMD 。这些处理器可以在每个数据路径中处理两条指令 , 与 RDNA 2 图形处理器相比 , 理论上至少可以达到两倍的指令速率 。
然而 , 这只是理论上的可能性 。作为这种设计的结果 , 在实践中实际可以看到多少加速将在很大程度上取决于驱动程序中的编译器 。
RDNA 3 CU 单元的新颖之处当然是独立的 AI 加速器(总共 192 个 , 每个 CU 单元 2 个) , 用于加速矩阵乘法等操作 。现在的第二代光线追踪单元也得到了改进 。
Navi 31 GCD 的光线追踪单元支持额外的指令 , 光线追踪得到改进和优化 , 并根据场景进行分类 。与 RDNA 2 架构相比 , AMD 承诺每个 CU 的性能提升高达 50% 。
最后 , 当我们谈到 Navi 31 中的 GCD 时 , 与 RDNA 2 图形芯片相比 , L0、L1 和 L2 缓存内存的数量有了显着增加 。
Radiance 显示引擎 :165 Hz 时 8k!
如果我们回到小芯片 MCD , 我们可以说 AMD 在使用 320 或 384 位总线方面增加了内存带宽 , 尽管仍然使用 GDDR6 内存 。
有趣的是 , L3 缓存或 Infitnity 缓存的数量小于 RDNA 2 Navi 21 图形处理器的数量 , 以降低能耗 。另一方面 , 与 RDNA 2 芯片的 1.2 TB/s 相比 , Infinity 缓存现在的速度是 2.5 TB/s 的两倍 。
AMD|AMD首发 GPU正式进入Chiplet时代!
文章图片

Navi 31 还带来了显着改进的 GPU 部分 , 负责图像显示和多媒体 。首先 , 新的 Radiance Display Engine 全面支持 DisplayPort 2.1 , 它可以通过单根电缆以 165 Hz 的 8k 分辨率或 480 Hz 的 4k 分辨率显示图像 。
每个通道还可以使用 12 位彩色显示 。与仍“仅”支持 DP 1.4 的最新 Nvidia 卡相比 , 这是一个很大的优势 。
此外 , Navi 31 还可以通过两个独立的编码器/解码器对 AV1 编码和解码进行硬件加速 , 从而可以同时对两个视频流进行转码或以每秒两倍的帧数进行转码 。
AMD|AMD首发 GPU正式进入Chiplet时代!
文章图片

AMD 通过 Navi 31 图形芯片打破僵局 , 为图形处理器世界带来了真正革命性的小芯片 GPU 设计 。这将在未来证明有多成功还有待观察 。潜力当然是巨大的 。
在现代 GPU 中堆叠乐高积木的原理和小芯片的模块化听起来确实很有未来感 。
【AMD|AMD首发 GPU正式进入Chiplet时代!】