RTX 4080|影驰RTX4080星曜OC评测:雅致纯白高颜值,更有ARGB夺目炫光( 二 )


01/ Ada Lovelace架构与RTX 4080
GeForce RTX 4080 16GB显卡采用的是AD 103-300显示核心 , 该核心基于TSMC 4N工艺和Ada Lovelace架构核心进行制造 , 其芯片面积为378.6 平方毫米 , 晶体管密度为459亿 。
其中 , Ada Lovelace架构核心配备了全新的第三代RT Core(光线追踪核心)、第四代Tensor Core(张量核心)以及SM(流式多处理器) 。
根据NVIDIA官方的介绍 , Ada Lovelace架构核心所采用的第 3 代 RT Core 不仅将光线与三角形求交性能提高了一倍 , 还将 RT-TFLOP 峰值性能提高了一倍之多 。 第 3 代 RT Core 还配备了全新的 Opacity Micromap (OMM) 引擎和 Displaced Micro-Mesh (DMM) 引擎 , 进一步提升了光追计算的性能以及减少计算开销 , 带来了更好的光线追踪效果表现 。 Ada Lovelace架构核心配备的第四代Tensor Core更是引入了来自专业级H100数据中心GPU的 FP8 Transformer 引擎 , 从而带来了更加强悍的AI算力 。
第三代RT Core结构示意图 , 相比前代 , 增加了2个功能
Ada Lovelace架构核心在SM单元上引入了Shader Execution Reordering(SER 着色器执行重排序 )技术来更好的对于着色器的工作进行调度排序 , 在使用上可以根据不同的负载需求来执行渲染 , 可对负载较为统一的画面进行渲染 , 降低工作开销 。
根据英伟达官方的介绍 , 这一个SER功能将作为API开放给开发者使用 。 英伟达官方宣称 , SER功能的加入最 高可带来两倍RT Core性能上的改善 , 对于光追游戏来说更可带来体验的升级 。 根据NVIDIA官方的数据 , 全新的SM(流式单元处理器)可带来最 高两倍的性能以及能效升级 , 升级幅度是非常明显的 。
Ada Lovelace架构核心 SM结构图
Ada Lovelace架构核心除了第三代RT Core(光线追踪核心)、第四代Tensor Core(张量核心)以及SM(流多处理器)的升级以外 , 带来了全新的第八代NVENC双硬件编码器 , 这一全新的第八代NVENC双硬件编码器整合了对AV1视频编码格式的支持 , 可以在传统的H.264等格式之外 , 加入了对AV1这一主流新标准的支持 , 可以进行对于AV1格式的编码与解码 , 有效提升了生产力方面的表现 , 对于创作型用户、游戏主播等群体来说更是如虎添翼 。 来自NVIDIA官方的数据显示 , 第八代NVENC双硬件编码器在AV1的效率上比H.264编码器的效率提高了40% , 这一提升非常明显 。
除了核心上的升级以外 , Ada Lovelace架构核心还大幅度提升了其L2缓存 , GeForce RTX4080 16GB拥有64MB的L2缓存 , 大容量的L2缓存带来了数据命中率的有效提升 。 在现阶段显存带宽提升有效的情况下 , 通过升级更大容量的L2缓存 , 可以提升数据命中表现 , 带来性能方面的升级 , 根据NVIDIA官方的说法 , 大容量L2缓存的加入为GPU的一系列操作带来了更高的收益 , 尤其是在光线追踪等场景下 , 表现更为明显 。
RTX 4080 16GB核心架构图
Ada Lovelace架构的一系列升级还带来了全新的DLSS 3技术的独占以及NVIDIA Reflex方面的体验提升 。
DLSS 3包含有DLSS 2(DLSS超分辨率技术) , 以及全新加入的DLSS帧生成技术 , 这一项DLSS帧生成技术依托于Ada Lovelace架构的独立光流处理器以及Tensor Core的AI算力 。 在一项技术在运行过程中 , 其通过光流处理器所得到的一系列数据后 , 以光流加速技术(Optical Flow Acceleration , 简称为OFA)来生成画面信息 , 而AI算力则负责来对画面进行进一步的优化 , 从而在游戏中加入了更多的帧画面 , 进行帧数的提升 。
DLSS 3可直接生成游戏第1帧3/4的像素以及整个游戏第2帧 , 相当于使用1/8的算力 , 就完成了整个计算过程 , 而通过这一个流程的循环 , 可在提升帧数的同时节省资源开销 , 进一步带来更好游戏体验 。