算力|重新认识特斯拉:一家计算公司

抛开马斯克的自我造神,是时候重新认识特斯拉了。
在特斯拉的官网上,它宣称自己是一家电动车、太阳能和清洁能源公司。在一些人眼中,因为备受争议但持续演进的自动驾驶技术,特斯拉是一家人工智能公司。在不久前的特斯拉举办的首次AI Day上,因为一款酷似人形的机器人Tesla Bot的问世,不少人开始认为特斯拉是一家机器人公司。而马斯克经常说的一句话是:特斯拉是一系列初创公司的集合。
算力|重新认识特斯拉:一家计算公司
文章插图
然而在AI Day上特斯拉透露出的真正信号是:这是一家计算公司。
“计算公司”(Computing Company)看上去是一个大而无当的概念——尤其在这个遍地都是“算法”的互联网世界里。然而,算法更多的是一个软件概念,它是基于一定的数据结构的数据输入产生的新的输出结果。而除了数据和算法,构成“计算”的更核心部分是“算力”,也就是一部计算设备——无论是一台超级计算机、一部智能手机还是一辆智能网联汽车——的数据处理能力。它在很大程度上是硬件的能力,也就是芯片和计算模块的能力。这才是“计算”的本质。
从这个意义上说,一些充分掌握人工智能“算法”而未掌握核心“算力”的公司,并不能被称作是一家“计算公司”,比如开发了今日头条、抖音和TikTok的字节跳动,就还不能被称作是一家计算公司。在我们中国,华为是一家当之无愧的计算公司,阿里巴巴和百度也在逐渐地成为计算公司。在美国,英特尔、AMD和英伟达都是称得上是老牌的计算公司,苹果和谷歌是新晋的计算公司。抱歉,亚马逊和脸书还不是计算公司。
现在,“计算公司”的名单里多了一个特斯拉。
比起看上去神乎其神的机器人Tesla Bot,特斯拉在AI Day上发布的“D1”芯片和超级计算机平台“Dojo”才是真正的重头戏:它意味着特斯拉像苹果那样,具备了把整个生态从上游到下游,都掌控在自己手里的基础能力。
算力|重新认识特斯拉:一家计算公司
文章插图
“D1”是一款AI训练芯片,当然也是一款计算芯片。它采用7纳米工艺,单片FP32达到算力22.6TOPs,BF16算力达到262TOPs。根据特斯拉的演示,单颗D1芯片的神经网络算力超过一块显卡,也就是说特斯拉D1比英伟达的GPU和谷歌的TPU性能都强。特斯拉自动驾驶硬件高级总监、Dojo项目负责人Ganesh Venkataramanan说D1“完全是由特斯拉团队自主设计的芯片,从架构到封装。该芯片就像一个GPU,但又具有CPU级别的灵活性和两倍于网络芯片级别的上传/下载带宽”。所以,D1芯片既不是一款CPU,也不是一款GPU,而被直接称作“Pure Learning Machine”(纯学习机器)。
一颗颗D1芯片的无缝连接,构成了一个25颗D1芯片组成的机器学习模块,再把多个模块集成在一起,就构成了一台特斯拉自研的超级计算机——Dojo。Dojo的日语译文是“道场”,也就是修炼的地方。“修炼”的意象正符合一台超级计算机最核心的功能:对数据模型无休无止的机器学习和神经网络训练,炼成一颗超级大脑。
Dojo有超过50万个训练节点,每个节点的算力为9千兆浮点计算(fetaflops)。基于Dojo的架构,特斯拉又发布了ExaPOD——集成了120个训练模块,包含3000颗D1芯片,超过100万个训练节点,算力超过1100千兆浮点计算。特斯拉说:这就是全球最快的AI训练计算机。作为一家非常喜欢用“概念替换”的方式无限放大自身优势的公司,特斯拉甚至想宣称:这已经是全球性能最强的超级计算机。
算力|重新认识特斯拉:一家计算公司
文章插图