阿里达摩院研发存算一体AI芯片,性能提升超10倍,能效比提升300倍( 二 )


阿里达摩院研发存算一体AI芯片,性能提升超10倍,能效比提升300倍
文章插图
【 阿里达摩院研发存算一体AI芯片,性能提升超10倍,能效比提升300倍】设计方面,该芯片内存单元采用异质集成嵌入式DRAM(SeDRAM),拥有超大内存容量和超大带宽优势。
计算芯片方面,达摩院研发设计了流式的定制化加速器架构,对推荐系统进行“端到端”加速,包括匹配、粗排序、神经网络计算、细排序等任务。
得益于整体架构的创新,该芯片同时实现了高性能和低系统功耗,有效解决了带宽受限的问题,在大幅提升带宽的同时,实现了超低功耗。
在实际推荐系统应用中,相比传统CPU计算系统,存算一体芯片的性能提升10倍以上,能效提升超过300倍。
结语:后续将与阿里内部业务紧密合作达摩院计算技术实验室科学家郑宏忠认为:“存算一体是颠覆性的芯片技术,它天然拥有高性能、高带宽和高能效的优势,可以从底层架构上解决后摩尔定律时代的芯片性能和能耗问题,达摩院研发的芯片将这一技术与场景紧密结合,实现了内存、计算以及算法应用的完美融合。”
从达摩院最终的测试芯片来看,其创新架构有效缓解了由于数据搬运产生的瓶颈,并与数据中心的推荐系统对于带宽/内存的需求匹配。这展示了近存计算在数据中心场景的潜力。
目前,整个行业对存算一体芯片技术的研究依旧处于探索阶段,在工艺成熟度、典型应用、生态系统等方面仍不成熟。
达摩院希望逐步攻克技术难题,先研究基于三维堆叠的近存芯片,通过拉近存储单元与计算单元的距离、增加带宽,来降低数据搬运的代价,缓解由于数据搬运产生的瓶颈。
未来,达摩院会进一步攻克存内计算技术,在应用方面与阿里内部业务紧密合作,逐步针对内部AI应用场景适配优化。