华为徐直军:5G用户已经超过4.9亿,数字化转型从未如此现实、( 四 )


第三个阶段是系统性AI应用或智能子系统的开发,此时往往涉及多种应用、工具和系统的配合,ModelArts通过进一步增加MLOps、OptVerse求解器、科学计算、盘古大模型和异构分布式调度器以及来自生态伙伴的丰富的行业性组件与工具等支持企业实现极简、高效的智能系统开发 。让每一位工程师都能开发AI应用,是ModelArts矢志不渝的努力方向,期待这个目标早日实现 。
在AI用于各行业生产场景时,即使最高水平的AI专家,也往往感到十分挑战 。究其原因,各行各业场景繁多,非常碎片化,即使有自动化程度很高的工具,在通常的AI模型开发模式下,也不得不逐个定制开发,如同作坊式开发,投入人力多,开发周期长 。更为挑战的是,模型的精度通常需要大量的训练样本数据,可行业场景偏偏最缺数据,由此导致模型性能往往不能满足生产要求,导致AI在这些场景不可用 。
大模型为解决这类问题提供了很好的方案 。有了预先训练好的大模型,每个场景化AI开发,都不必再从0开始,而是基于大模型做增强训练,并自动化抽取出适合该场景部署的小模型,开发周期从月级缩短为天级,实现了AI模型从作坊式开发到工业化开发的转变 。
更为重要的是,由于是基于大模型做增强训练,模型性能大大提高,使很多原来AI不可用的场景变得可用了 。在华为南方工厂就有一个这样的案例,由于样本数量只有40个,传统方式训练的AI模型精度只能达到80%,无法满足要求;基于大模型训练的模型精度达到99.5%,使智能检测实现可用 。
第三,再谈一下企业网络 。
伴随着数字化的进程,企业网络的复杂性将指数级增加,主要原因包括:混合办公,互联分支增多,接入位置增多;员工流动性增大,体验变化更动态;办公网融合物联网,联接数激增;云化与新应用对网络性能要求更高、变更频繁;网络设备种类多、厂家多,管理规模大;网络保障从基于联接到基于体验,要求更高 。
但是,运维保障工程师数量不会线性增加,甚至不会增加,网络运维复杂性与运维工程师资源之间的差距会越来越大 。针对这个挑战,我们认为,企业网络的运维更应该首先用好数字化技术,用技术创新克服自身复杂性的增加,而不是依赖更多的人工 。
基于此,我们提出自动驾驶网络愿景,即未来的网络应该与自动驾驶汽车一样都能自己运维自己,而不是靠人 。我们期望未来的自动驾驶网络应该是:支持自动,即根据用户意图业务自动部署,最终目标是业务全自动部署;支持自愈,预测预防故障并基于事件自我恢复,最终目标是实现全自动运维;支持自优,根据用户体验自适应调整优化,最终目标是实现全自动优化;支持自治,在自动、自愈、自优的基础上,网络功能自适应、自学习、自演进;这是自动驾驶网络的愿景,也是终极目标 。
过去两年,我们不仅在华为覆盖全球的网络开展自动驾驶网络创新,也与金融、教育、医疗等行业客户开展联合创新和部署应用 。
在金融行业,我们与中信银行(行情601998,诊股)聚焦数据中心网络的自动驾驶创新 。2020年,自动驾驶网络帮助实现了单数据中心、单厂商的40多类业务场景的端到端业务自动化 。今年的创新方向是支持多云、多厂商的异构场景 。以一个“留学汇”的新业务上线为例,过去多域网络的协同设计、评估和变更平均耗费30多天,现在只需要30分钟就能实现 。
在数据中心网络里面,最头疼的问题是如何快速定位故障点,现在华为自动驾驶网络既支持了端到端的网络质量可视,还对75类典型故障实现了3分钟定位根因,5分钟给出修复建议,今年基于知识图谱的自学习能力,现网数据实现了在线增量学习,可覆盖97%的故障 。