数字|阿里灵杰:AI工程化助力产业数字升级

对于人工智能领域而言,“工程化”无疑是贯穿2021全年的热点。Gartner、德勤、中国信通院等权威研究机构先后在年度趋势报告中指出其必要性,与此同时,AI产业化的曲折探索也时刻提醒着大大小小的AI团队关注工程建设与规模化。
潮起潮落后,一个不容忽视的趋势已经显现:只有真正贡献于各行各业的数字化发展,AI才能不断迭代前行。这背后,亟需对数据计算分析、模型开发部署、在线训练推理、应用开发运维等各种环节进行全周期管理。而这恰恰是阿里灵杰——阿里云大数据+AI一体化产品体系所期望和擅长的。
12月3日,2021阿里灵杰AI工程化峰会圆满落幕。阿里巴巴集团副总裁、阿里云智能计算平台事业部负责人、达摩院 AI 平台负责人贾扬清,达摩院语音实验室负责人鄢志杰,阿里云智能研究员、机器学习PAI平台和大数据平台技术负责人林伟等11位技术牛人亮相本次峰会,与开发者共同探讨AI落地产业的路径探索与创新实践。
贾扬清:从需求视角出发,拥抱云原生的AI时代
阿里巴巴集团副总裁、阿里云智能计算平台负责人、达摩院 AI 平台负责人贾扬清以一名AI老兵的身份,分享了经历多次浪潮后的观察。他把早期的AI开发人员比作“拓荒者”,身兼算法研究员、软件工程师、数据工程师、系统工程师多种角色,尝试把AI算法和应用逐渐落地。
(图:阿里巴巴集团副总裁、阿里云智能计算平台负责人、达摩院 AI 平台负责人贾扬清分享“一个AI开发者的奇幻漂流”)
随着技术发展,组件数量和模型算法的复杂度都在增加。时至今日,需要搭建一个统一的空间来拉通数据管理、算法迭代、模型训练及上线各环节。贾扬清总结道,“AI的痛苦在于本质上没有范式。AI不是一个单点的产品,而是一系列能力的组合;另一方面,AI对标准的软件和定制化服务协同的需求极强。”
因此,“AI开发者需要的,不是从资源视角搭建起来的平台;而是从需求出发,通过云原生、容器化方式链接资源的平台”,这正是打造阿里灵杰的初衷。今年10月刚刚发布的阿里灵杰,通过一体化的大数据与AI产品体系,向用户提供10万台以上计算集群的弹性算力、上百种标准化算法和模型服务、以及覆盖数据处理和机器学习全链路的管理能力。
(图:阿里灵杰全景)
简言之,阿里灵杰的核心价值在于,帮助今天的AI开发者更好地将数据、算法和场景结合起来,构建更完整更复杂的解决方案,去解决产业中的实际问题。
【 数字|阿里灵杰:AI工程化助力产业数字升级】阿里灵杰AI工程平台:全链路提升效率
阿里云机器学习平台PAI和大数据平台技术负责人林伟认为,数据、计算力、和算法有机结合才能推动AI爆发,阿里灵杰也基于三要素形成了独特的思考和实践。
第一,数据质量决定模型的高度。因此,阿里灵杰从诞生第一天起就采用大数据与AI一体化的架构,通过湖仓一体实现对多元异构数据的存储管理,通过DataWorks和智能标注产品实现数据质量提升和监控,通过MaxCompute、Hologres、Flink等计算引擎完成实时或离线分析处理;
第二,算法开发迭代速度是重要生产力。云原生的灵杰平台能提供弹性的计算力,并具备良好的异构硬件和端设备适配性,能提升模型开发和部署效率。面向大模型,灵杰机器学习平台的Whale框架可自动实现分布式训练,FineTune框架可基于预训练大模型蒸馏出垂直场景的小模型,提升大模型生产速度和应用价值;
第三,AI系统能力是核心能力。阿里巴巴集团内部AI应用需求极大,推动着灵杰机器学习平台PAI的核心引擎不断发展优化,覆盖超大规模稀疏模型训练及服务、超大规模多模态预训练模型、自动编译、大规模集群调度、ML Ops等方向。