华为徐直军:5G用户已经超过4.9亿,数字化转型从未如此现实、( 三 )


随着云原生应用深入企业各个业务场景,云原生正在走向分布式,跨云跨地域统一协同治理,保证一致应用体验等新的需求日渐突出 。为了匹配这一需求,我们通过持续创新,推出业界首个分布式云原生产品 。
今天,我正式发布华为分布式云原生产品,华为云UCS!UCS的意思是无处不在的云原生服务:通过华为云UCS,我们致力于让企业使用云原生应用时感受不到地域限制,感受不到跨云限制,感受不到流量限制,充分保证应用的一致性体验 。UCS的目标是要把云原生能力带入企业的每一个业务场景,加速千行百业拥抱云原生 。
其次,和大家探讨一下人工智能 。
2018年10月,我在上海华为全联接大会上发布了华为全栈全场景AI解决方案;2019年8月23日我在深圳正式宣布了AI计算框架MindSpore开源计划 。发展到今天,这些计划都得到了圆满的实施 。
首先,硬件方面,已经有超过10个硬件合作伙伴推出基于昇腾模组、板卡的AI硬件产品 。
其次,MindSpore在2020年3月如期开源 。截至2021年8月底的1年多时间内,社区累计下载量超过60万,目前已经是中国最活跃的AI社区,有超过100家高校选择MindSpore进行教学,可以说,MindSpore已经成为中国主流AI计算框架 。
此外,还有500多家合作伙伴基于昇腾开发了600多种AI解决方案,应用于各行各业 。总体上,全栈全场景AI发展符合预期 。
在2019年的华为全联接大会上,我们首次发布了Atlas 900集群,那时候单集群支持1024个昇腾910芯片,总算力达到256P Flops 。经过两年的努力,Atlas 900单集群已经能够支持4096颗昇腾910,在全无阻塞网络下进行高速计算,提供每秒100亿亿次浮点运算的强大算力 。
在此集群基础上,华为云ModelArts通过引入集群间动态自适应路由技术,根据电力约束的不同,可以将集群规模再扩大4~32倍,总算力最高达到32E FLOPS,训练线性加速比超过85% 。目前Atlas 900集群和基于Atlas 900集群的云服务已经服务于300多企业客户,广泛应用于交通、金融、能源、制造、医疗等行业,支撑众多企业、科研单位系列大模型的开发训练 。
目前已经成功训练出了一系列大模型,包括:华为云盘古NLP中文大模型;华为云盘古计算视觉大模型;华为云盘古药物分子大模型;华为云盘古科学计算大模型;遥感专用框架LuojiaNet;鹏城盘古NLP中文大模型;鹏城生物制药大模型等 。
在我发布的全栈全场景AI战略中,ModelArts属于AI应用使能层,其使命是让AI应用开发简单、简单、再简单,以解决AI人才和专家匮乏的问题 。当初的期望是,通过ModelArts,要让每一位工程师只需掌握一定的AI技能,就能够自己开发AI模型和AI应用 。经过3年多的努力,数以千计的AI行业应用项目的实践,不断创新与知识沉淀,面向企业数字化转型与AI应用的不同阶段,形成了全流程、场景化的服务 。基于这些服务,应当说我们初步实现了预期目标 。
对于企业来讲,开发AI应用有三个阶段,针对不同阶段和场景,ModelArts有了针对性的服务:
在初始阶段,大量的企业或总体上,或在特定任务上,还处于探索性AI试验阶段,这个阶段的主要诉求是开发出一个模型,验证初步可行性,处于这个阶段的企业的AI能力往往最为欠缺 。针对性地,ModelArts通过领域套件、场景样例、盘古大模型、预训练模型等服务和开发工具,使得一般的工程师在简单学习之后,基本不用开发代码就能够快速训练出AI模型,快速验证,快速上手 。
第二个阶段是Quick win,即在试验成功的基础上,期望快速通过AI为企业创造价值,此时的AI开发不再是研究性模型开发,而是要针对一个或多个特定生产任务,结合特定部署场景,结合特定行业规范,满足可信等生产性要求 。ModelArts通过增加可信组件与安全算法、ModelBox、AutoSearch、盘古大模型等使AI工程师能适应多样性的部署环境,快速开发生产性实战型AI应用 。