IBM|IBM AIU芯片揭秘:5nm 32核心、230亿个晶体管!( 二 )


简化人工智能工作流程
由于大多数 AI 计算都涉及矩阵和向量乘法,因此IBM AIU芯片架构具有比多用途 CPU 更简单的布局 。
IBM AIU还针对将数据直接从一个计算引擎发送到另一个计算引擎进行设计,从而节省大量能耗 。
IBM|IBM AIU芯片揭秘:5nm 32核心、230亿个晶体管!
文章图片

据IBM介绍,其AIU芯片是一个完整的片上系统,是基于IBM此前的Telum芯片(7nm工艺)中内置的经过验证的 AI 加速器的扩展版本,并且采用了更先进的5nm制程工艺,具有 32 个处理内核并包含 230 亿个晶体管 。
IBM AIU 还被设计为像显卡一样易于使用 。它可以插入任何带有 PCIe 插槽的计算机或服务器 。
IBM|IBM AIU芯片揭秘:5nm 32核心、230亿个晶体管!
文章图片

IBM表示:“部署 AI 对照片中的猫和狗进行分类是一项有趣的学术活动 。但它不会解决我们今天面临的紧迫问题 。我们要让 AI 解决现实世界的复杂性——比如预测下一个飓风伊恩,或者我们是否正在走向衰退——我们需要企业级的工业级硬件 。我们的 AIU 让这一愿景更近了一步 。”
IBM AIU表现如何?
IBM并未在其官网公布更多关其AIU芯片的技术信息 。不过,我们可以通过回顾 IBM在 2021 年国际固态电路会议(ISSCC)上展示其早期 7nm 芯片设计的性能结果时的初始原型演示来对其性能有所了解 。
IBM 用于会议演示的原型不是 32 个内核,而是一个实验性的 4 核 7nm AI 芯片,支持 FP16 和混合FP8 格式,用于训练和推理深度学习模型 。
它还支持用于扩展推理的 int4 和 int2 格式 。2021 年 Lindley Group通讯中包含了原型芯片性能的摘要,该通讯报道了 IBM 当年的演示:
在峰值速度下,使用 HFP 8,该7nm芯片实现了每秒每瓦特 (TF/W) 1.9 teraflops 。
使用INT4进行推理,该实验芯片达到16.5 TOPS/W,优于高通低功耗Cloud AI模组 。
考虑到IBM AIU是该测试芯片的扩展版本,并且制程工艺也升级到了5nm,因此预计其整体能效将进一步提升,同时随着核心数量由4核上升到32核,其整体的峰值算力有望提升超过8倍 。
【IBM|IBM AIU芯片揭秘:5nm 32核心、230亿个晶体管!】Forbes的分析师认为,由于缺乏信息,无法将IBM的AIU与目前被用于AI计算的GPU相比较,但是,预计该芯片的价格将会在1500 美元到 2000 美元之间 。