海马云|元宇宙需要全新的云计算基础设施( 三 )


特点一,协同计算。元宇宙内容的渲染精度和渲染复杂性应该会超出任何一张单张显卡或者单机的性能,而且就算按照半导体的发展速度,在可见的未来,也不可能用单张显卡能够搞定元宇宙这样级别的一个渲染,所以我们一定会在集群的协同计算上要有很多算法的突破,这一块不仅要多卡,还要实现跨物理机,甚至未来要跨物理节点,在一个覆盖全国算力的网络上去做协同计算。这块会面临很多的挑战,包括底层的,包括算法的,包括引擎层面的事儿。
特点二,实时性。所有的渲染、计算必须要保证实时,因为未来元宇宙一定是实时内容,内容是实时生成的,会根据用户的交互实时产生内容。所以说任何之前的工业标准在元宇宙的语境下可能都会面临很大的挑战,因为实时性对于整个算法的优化,对于底层架构的构建是完全不一样的。
我们认为按照实时性和协同计算的要求,未来整个算力一定是个分布式的网络,是一个覆盖到中心、边缘,甚至端侧协同的一个分布式的算力网络,然后我们认为这块整个基础设施是基于云原生的理念来构建的,因为只有基于云原生理念我们才可能做到性能、成本足够的优化,能够满足未来整个元宇宙发展的底层的设施的要求。
这里面我们在讨论基础设施构建的时候,会面临很多关键的技术:
第一块,我们觉得应该要定义云原生的GPU,现有的显卡在整个定义上它本质上还是按照工作站单机的角度去定义的,就算把现在的显卡放到服务器侧,这个架构的优化本身它并没有专为云原生,专为元宇宙的需求去做优化,所以说在性能和成本上其实并不是最优的。我们认为在这一块未来要满足整个元宇宙基础设施,整个计算集群的要求,在GPU的设计上从一开始就要考虑到为云原生来优化,比如说渲染和编码,我们如何在芯片层能够直接把它搞定,在整个的IO和内存层面我们如何消除一些数据搬运的瓶颈,这些都是在GPU设计层面要思考的。我们也正在和国内的GPU团队在探讨,如何去定义未来基于元宇宙的云原生GPU。
第二块,服务器一定是高度定制化的,考虑算力的密度、功耗、体积等等,要有一个足够高的性价比来来支撑上层的业务。
【 海马云|元宇宙需要全新的云计算基础设施】在整个基础设施里面有一个很重要的点就是网络,因为我们要实现跨物理节点,跨IDC节点的协同计算,数据的搬运和吞吐对网络的传输和延时要求会非常的高,现有的网络应该很难满足这么大量的协同计算的要求。所以说运营商那边也正在规划一个叫算力网络的东西,在规划中应该是要构建一个基于全光交换的网络底座,来实现整个物理节点之间的互联。
那么硬件层构建完以后,软件层面我们刚刚讲到了协同渲染,涉及到图形接口、引擎等等一系列工作要重新去定义。然后上层还会有基于AI的内容生成来解决元宇宙整个环境下大量的3D内容如何去构建,如何去产生的问题。
整个底层做完我们还需要一套云原生的工具包,为整个开发生态、使用生态、消费者生态和生产者生态提供一套基于云原生语境的开发包,能够让广大产业链的参与者能够在整个元宇宙的基础设施上做内容的开发,做内容的构建。
所以说海马云我们正在思考要建一个元宇宙的开放平台,我们正在去做内部很多的研发和规划的考虑,也在做一些技术的储备。我们设想中整个元宇宙,基于云原生的开放平台应该是这么一个架构,底层是算力和网络,中间那一层是我们所谓的协同计算、协同渲染引擎,上层是所有的应用。我们在云原生语境上,让上层的应用开发所见即所得,因为按照元宇宙的语境来看待内容,现有的工作站的开发模式其实很难实现所见即所得,它本身的算力会超出本地能够支撑的极限,所以说我们基于分布式的算力和网络,然后再做一层通用的渲染引擎,在上层再来提供整个元宇宙的工具包。