显卡|GPU国产替代潮 无路可退 也没有人想投降

“如果因为层层加码的外部限制,就直接啥也不做了 。那我当初创业是为啥呢?”一名头部国产GPU创业公司的CEO对品玩表示 。
2022年10月7日,美国商务部下属的工业和安全局(BIS)发布厚达139页的对华半导体出口管制措施,影响程度被形容为“把对华为的管制扩大到整个中国半导体产业” 。这次扩大的限制并非毫无征兆,8月31日,英伟达披露美国政府已对其提出出口管制要求,禁止其两款高性能GPU产品出口中国 。
这些步步紧逼的限制封锁指向的一个重要目标,就是极度依赖GPU算力来发展的人工智能 。
支撑人工智能的深度学习系统,可以存在于你的手机里,但更多时候需要数据中心里连在一起的机器“集群”来实现 。数十个鞋盒一样大的服务器层层叠插在和人一样高的“货架”上,一排排架子再塞满仓库一般的数据中心 。一颗颗GPU就运转在这些盒子一样的“仓库”里 。
今天在世界各地的大“仓库”里,英伟达的GPU最多 。而这些GPU的计算能力超出普通人的想象,甚至最大胆的科幻家也会感到惊奇——在2003年的科幻电影《终结者3》里,那个差点毁灭人类的超级计算机“天网”,算力为60tflops(也就是每秒6万亿次浮点计算),今天英伟达最先进的数据中心GPU H100,在特定精度下,算力达到了67 TFLOPS 。
与算力一样迅猛增长的还有市场规模 。根据Verified Market Research 估算,预计2027年中国大陆GPU市场规模将超过345.57亿美元 。
这是一个前所未有的大市场,也是一个被封锁最深的技术领域 。美国人几近疯狂的限制,想要遏制中国本土企业取得任何进步,但面对一生难遇的巨大机会,给外国巨头打工多年的华人芯片从业者没人想要再退缩 。
“我们能够替代它”
2018年6月,出乎业界预料的,AMD 抢在英伟达之前,发布了全球首款7纳米制程的GPU芯片,命名Radeon Vega 。这款产品并非针对游戏市场,而被定义为专为人工智能和深度学习设计,用于工作站和服务器 。
让人工智能达到今天的水平的一大功臣是神经网络 。
神经网络本质上依靠的是大量的乘法和加法:当一个网络中的“神经元“彼此激活时,它们也会对彼此的信号进行放大或者缩小,乘以一些权重数 。
这个过程其实就是在计算大量的加法和乘法 。而GPU最初被设计出来要解决的就是类似的工作:快速的同时做大量乘法和加法,来算出所有图形,从而生成游戏里的一个个画面 。
GPU的巨大机会从游戏转移到人工智能的市场,而这块首个7纳米GPU的发布,也意味着在显卡行业追赶英伟达的AMD,把战火也引入到了人工智能行业 。
这个激进的策略充满挑战,AMD的高管当时形容:“转换到7纳米制程是近几代芯片设计最困难的路程,涉及使用新CAD工具及多项设计改变 。7纳米的晶体管连接方法比较特殊,AMD必须与半导体厂更加密切的合作” 。
不过,在当时对这块芯片的各种讨论中,却基本没人提及负责设计它的团队 。
2018年,钱军在AMD上海负责GPU SoC核心部门,带领800多人的团队,从他团队手上流片的芯片已有40多颗 。在诸多国外芯片厂商中,AMD是在中国建设研发团队最积极的那个,到2018年这个研发团队规模数千人 。这块全球第一枚7纳米GPU芯片,就是钱军带领的团队开发的 。
而六个月后,钱军离职创业,创办中国芯片公司——瀚博半导体 。
2018年的GPU和芯片创业领域,其实国产替代的概念还没有今天这么强的压迫感,也没有伴随而来的热钱 。在事业蒸蒸日上的时候离开AMD,钱军自己称,就是因为自己认为自己能做的更好 。