sow|特斯拉造Dojo超算,台积电出来认领:里面的这个东西是我做的( 二 )



sow|特斯拉造Dojo超算,台积电出来认领:里面的这个东西是我做的
文章插图

现在已经有了搭房子的砖瓦,接下来便要考虑如何建房子了。基于D1芯片,特斯拉在系统层面设计了「训练模块(Training Tile)」,训练模块就是Dojo超算的基本构成单位。
一个完整的训练模块上集成了25个D1芯片,并进一步封装了总带宽为36TB/s的连接器、具备15kW散热能力的水冷系统以及供电模块。性能表现上,一个训练模块BF16/CFP8精度下的浮点算力总算力为9PFLOPS。
然后120个训练模块共同构成ExaPOD,即特斯拉Dojo超算的最终硬件形态,其总算力在BF16精度下达1.1EPlops。
拆解完Dojo的基本架构,现在请回忆一下特斯拉在打造Dojo超算时希望解决的核心问题,其核心目标是希望在各个层级上帮助拓展带宽并减少延迟。

sow|特斯拉造Dojo超算,台积电出来认领:里面的这个东西是我做的
文章插图

当D1芯片本身已经拥有了极高的带宽(10TB/s的片上带宽、4TB/s的片外带宽),那么紧接着的一个问题就是如何实现芯片之间的“无缝连接”,保留芯片之间的最大带宽,在系统层面解决带宽与延迟问题?因为通常来说,芯片间的连接方式和物理距离对带宽和延迟有着决定性的影响。
特斯拉在这一步上用到了台积电的先进封装技术InFO_SoW技术,这也是我们下一节的内容。
什么是InFO技术?
美国时间8月22日,在一年一度的集成电路产业盛会Hotchips上,台积电Pathfinding for System Integration副总经理余振华就台积电的先进封装技术路线图进行了分享。
其中,面向超高性能计算系统,余振华给出了InFO_SoIS和InFO_SoW两种技术,并在演示图中“附赠”了一个有关特斯拉AI Day的博客链接。
特斯拉在集成25个D1芯片时用了台积电的InFO_SoW,有了官方实锤。

sow|特斯拉造Dojo超算,台积电出来认领:里面的这个东西是我做的
文章插图

一枚芯片的诞生,包括芯片设计和生产制造两个环节。制造过程中,沙子进行提炼处理得到芯片的原材料硅,然后再通过纯化、拉晶、切割等工艺得到硅晶圆(即晶圆,wafer),只是完成了第一步。
从硅晶圆到做出一个能满足功能需求的电路架构(芯片),还有成百上千道工序。其中,芯片本身是娇贵的器件所以需要给它“保护壳”,而单颗芯片上的电极(被称为pad或者是bump)又需要与外界电路连通后才能工作,简单来说芯片厂商做的这部分工作就被称为「封装」。
台积电的InFO_SoW技术是一个整合了InFO技术、动力和散热模块的晶圆级系统,也是一种封装技术。曾经台积电打败三星拿下苹果代工订单,凭借的就是更为成熟的InFO技术。
InFO(Intergrated Fan-Out),整合扇出型封装技术。
下面简化版的示意图展示了用InFO技术封装后器件的基本架构,从上到下是用于固化的环氧树脂、晶片(Die)即单个的芯片、导线重布层(RDL)、外部金属球、印刷电路板(PCB)。所谓的扇出区就是图中黄色的部分,代表金属球超出了晶片的大小,简单去理解就是说把单个芯片上电极和外部的连接点,放到了芯片的外面。

sow|特斯拉造Dojo超算,台积电出来认领:里面的这个东西是我做的
文章插图

就制作过程而言,其大致流程是先准备一个载体(通常是玻璃),并在上方涂抹形成一个暂时贴合层。然后把导线重布层(RDL)做到暂时贴合层上方,接着将切割好的晶片放置于导线重布层上方。
放置芯片的时候,单个芯片中间会留有间隔(形成扇出区)。然后用环氧树脂盖住,再加上外部金属球,形成一个封装好的半导体。最后,再整个粘到印刷电路板上面。