AMD|AMD RDNA架构技术传奇王启尚专访:专注每瓦性能 小芯片有大优势( 二 )


该技术是AMD高级媒体框架(AMF)的一部分,基于着色器,改进编码时文本的质量,不过仅支持Windows 11 DX应用,且最高支持分辨率为1080p 。
王启尚还详细介绍了AMD的两种串流新技术,都集成在AMD录制与直播中 。
一是“串流预分析”(Pre-Analysis),可以分析视频帧中每个区块(block)的时间活动和空间复杂性,并提取其他视频属性,比如场景变化、静态场景、运动强度等 。
根据所使用的前向缓冲区的深度,该技术可以在实际编码之前,分析最多达40帧画面,让编码器提前得知未来帧的特征,从而采取主动行动,提升视频画面质量 。
此外,它还可以提高编码效率,为视频流中与其他块有着更高相关性的块提供更多的码率 。
还有“串流预滤波”(Pre-Filtering),一个低通感知保边滤波器,可以去除帧画面中视觉上不重要的细节,而过滤强度可以根据视频内容、目标码率自适应,最终能在同等码率下实现更高质量的编码 。
——功耗:专注每瓦性能、小芯片设计有个最大优势
性能之外,用户对于CPU处理器、GPU显卡的功耗问题越来越重视,毕竟,节能减排是社会大趋势,是绿色可持续发展的根本 。在这方面,高能效的RDNA架构正好契合 。
王启尚表示,提高性能以满足不断增长的现代游戏需求是当下、未来的重点,需要不断改进芯片的设计和架构,但是提高性能的时候,一定又会产生更多的功耗,所以必须思考如何改变核心架构 。
RDNA3就充分体现了AMD在能效即每瓦性能上所花费的大量心思,在RDNA2 提高54%的基础上,再一次提高了54%,显示了AMD有能力、有决心继续打造更节能、更安静、更低温的显卡 。
AMD|AMD RDNA架构技术传奇王启尚专访:专注每瓦性能 小芯片有大优势
文章图片

比如RX 7900 XTX,对比上代RX 6950 XT,提供了大幅提高的性能和大量的新体验,但功耗只增加了25W 。
更进一步,AMD在设计RX 7900系列显卡时,选择了性能、功耗的更佳平衡点,希望带来更有能效的显卡,不需要额外的转接头,两个标准的8针电源接口即可供电 。
而说到功耗控制,就绕不开制造工艺,其越先进,就可以带来越好的能效 。
RX 7900系列使用的是台积电5nm制造工艺,而竞品RTX 40系列使用的是所谓台积电4N 。
对此,王启尚表示,AMD和台积电在制造工艺优化方面有着很深的合作关系,RX 7900系列基于AMD与台积电合作开发且调优的5nm工艺,具有更高的功率、性能和更小面积 。
对其他厂商可能使用市场叫法来命名其5nm制程工艺,王启尚表示不发表任何评论 。
此外,RX 7900系列第一次引入了chiplet小芯片设计,就像AMD锐龙、霄龙处理器做的那样 。
王启尚提出,chiplet设计的最大优势,就是便于选择使用最合适的制造工艺完成适当的工作,比如计算核心使用比较昂贵的5nm工艺,实现出色的每瓦性能,I/O核心、Infinity Cache高速缓存则使用成熟的6nm工艺,最终在每个价位上实现更强的性能 。
——竞争:RX 7900 XTX的真正对手是它!
有趣的是,我们的第一反应是RX 7900 XTX要竞争RX 4090,不过王启尚表示,从市场定价来讲,RX 7900 XTX对标RTX 4080是更合适的,有着额外的8GB GDDR6显存、更宽的384-bit位宽、领先的DisplayPort 2.1技术等 。
顺带一提,王启尚还确认,RX 7900系列显卡没有着色器执行重排序(SER) 。
在他看来,在光线追踪的实现中,将光线遍历和光线着色混合在一起是没有必要的 。他表示:“你可以看到从RDNA 2到RDNA 3,在光追上面的比较,在性能上面其实有很大的进步,所以我们觉得这样混在一起对我们架构来说是没有必要的 。”