芯片|国产GPU芯片“每秒千万亿次计算”

【芯片|国产GPU芯片“每秒千万亿次计算”】昨天 , 壁仞科技在上海发布了公司自主研发的首款通用GPU芯片BR100 , 其16位浮点算力达到1000T以上、8位定点算力达到2000T以上 , 单芯片峰值算力达到PFLOPS(1PFLOPS等于1000万亿次浮点指令/秒)级别 。 中国科学院院士、深圳大学校长毛军发表示 , 这一科技成果具有重大意义 , 有助于我国参与全球算力竞争 。
GPU中文名为“图形处理器” , 高性能GPU是提供通用算力的核心部件 , 也是我国集成电路产业的一块短板 。 这种芯片具有强大的并行数据计算能力和良好的可编程性 , 是国家数字经济的重要支撑之一 。 只有实现高性能GPU自主可控 , 才能保证我国算力基础设施的安全性和自主性 。
BR100峰值算力达到国际厂商在售旗舰产品3倍以上 , 创下国内互连带宽纪录 。 它也是国内率先采用芯粒(Chiplet)技术和新一代主机接口PCIe 5.0、率先支持CXL互连协议的通用GPU芯片 。 “BR100的发布 , 标志着国产通用GPU芯片进入了‘每秒千万亿次计算’时代 。 ”壁仞科技董事长兼CEO张文说 。
这款芯片之所以能实现国际领先的算力 , 最底层的支撑来自原创的芯片架构 。 昨天 , 壁仞科技还发布了自主原创架构“壁立仞”、OAM(操作维护管理)服务器“海玄”、OAM模组“壁砺100”、PCIe板卡产品“壁砺104”以及BIRENSUPA软件平台 。
壁仞科技联合创始人、CTO洪洲介绍 , “壁立仞”架构以数据流为中心 , 对数据流进行深度优化 , 通过六大技术特性 , 比较完整地解决了数据搬移的瓶颈和并行度不足的问题 , 使BR100芯片在给定的工艺下实现了性能和能效的跨越式进步 。下转 3版
(上接第1版)洪洲还发布了BR100系列的另一款产品BR104 。 这款芯片同样基于“壁立仞”架构 , 拥有1个计算芯粒 , 性能约为BR100的一半 。
除了研发大算力芯片 , 公司还以客户需求为出发点 , 提供软硬一体的解决方案 。 发布会上 , 壁仞科技联席CEO李新荣介绍了自主研发的BIRENSUPA软件平台 , 这个平台构建在BR100系列产品的底层硬件之上 , 由驱动层、编程平台、框架层和应用解决方案构成 , 支持各类应用场景 。
在发布首款通用GPU芯片的同时 , 壁仞科技已在积极布局商业化落地 。 发布会上 , 平安科技董事长兼CEO黄宇翔表示 , 公司将以平安云为基础 , 结合壁仞科技产品共同打造高端通用智能的算力平台 , 针对不同的用户场景推出产品和解决方案 。 采访人员 俞陶然