AMD|AMD、Intel已用上 NVIDIA这次落后了?

虽然摩尔定律已经逐渐走到尽头,但我们却来到了一个更加看点十足的时代,不同于以往每隔18个月靠工艺迭代带来的常规演变,以英特尔、英伟达和AMD为首的芯片巨头之间的竞争变得异常激烈 。
从英特尔、英伟达、AMD三家的产品布局来看,三家几乎都集齐了CPU、GPU甚至是DPU产品线 。如今,他们正在酝酿更大的规划!
随着近日AMD推出CPU和GPU组合的下一代数据中心APU——Instinct MI300,自此,三家的“多PU组合”争斗战已然打响 。
在此之前,英特尔的Falcon Shores XPU混合搭配CPU + GPU,英伟达的Grace Hopper Superchip是Grace CPU + H100 GPU的组合,都是如出一辙 。
他们都在做一件伟大的事情:在一个芯片中集成CPU、GPU和AI加速器,最终成为一个类似APU的产品,目标是更广阔的超级计算市场 。
但是在实现方式上,英伟达落后了?
英特尔的XPU计划之一:Falcon Shores
首先来说下英特尔的XPU计划?XPU是指使用多种计算架构以最好地满足单个工作负载的执行需求的想法,这是英特尔过去几年来最感兴趣的一个方向 。
英特尔希望将X86和Xe结合起来用于超级计算/HPC市场 。这也导致了英特尔开始研发从CPU、GPU个一些ASIC产品(如IPU、VPU、FPGA)等等各种产品 。
在英特尔2022年年度投资者会议上,英特尔披露了一个代号为Falcon Shores的处理器新架构,它将x86 CPU和Xe GPU硬件组合到单个Xeon插槽芯片中,利用下一代封装、内存和 I/O 技术,为计算大型数据集和训练巨大 AI 模型的系统提供巨大的性能和效率改进 。
不过英特尔的目标似乎不仅仅是将CPU和GPU集成在一起,英特尔正在寻求为拥有绝对海量数据集HPC用户开辟市场——这种数据集无法轻松适应独立GPU相对有限的内存容量 。
Falcon Shores的目标是在2024年推出,采用埃米级制程,这意味着它可能会使用Intel 20A或Intel 18A制造工艺制造 。
英特尔预计Falcon Shores在多个指标上比当前一代产品增长5倍,包括每瓦性能提高5倍,单个 (Xeon) 插槽的计算密度提高5倍,内存容量增加5倍,内存带宽增加5倍 。
AMD|AMD、Intel已用上 NVIDIA这次落后了?
文章图片

图源:pcper
英特尔表示,Falcon Shores的混合设计是通过使用tile(也称为小芯片)实现的,通过提供x86和Xe内核之间的灵活比例,这将使芯片制造商在设计过程的后期配置芯片方面具有更大的灵活性 。
【AMD|AMD、Intel已用上 NVIDIA这次落后了?】AMD发布Instinct MI300 APU
近日,AMD在CES 2023上披露了其下一代数据中心处理器Instinct MI300,被AMD称之为下一代数据中心APU 。它采用了13个Chiplet,共有1460亿个晶体管,MI300可以说是AMD迄今为止最大的芯片 。
该芯片的计算部分由九个5nm小芯片组成,它们包含CPU或GPU内核,但AMD没有详细说明每个小芯片的使用数量 。
这九个裸片被3D堆叠在四个6nm基础裸片之上,而且这些裸片是有源的中介层,可以处理 I/O和各种其他功能 。从下图中可以清晰的看到,Instinct MI300中心芯片侧面的八个HBM3堆栈 。
AMD|AMD、Intel已用上 NVIDIA这次落后了?
文章图片

图源:Future
MI300的关键优势除了将CPU内核和GPU内核放在同一设计中的操作简单性之外,还在于它可以让两种处理器类型共享一个高速、低延迟的统一内存空间 。
这将使在CPU和GPU两个核之间快速且轻松的传递数据,能让每个核处理他们最擅长的计算方面 。此外,它还可以通过让两种处理器类型直接访问同一内存池,简化插槽级别的HPC编程 。