算法|缓解数据安全与应用价值对立难题,隐私计算加速落地

海量数据散落在众多机构和信息系统中,形成“信息孤岛”,数据要素的经济社会价值无法得到充分发挥。同时,在强监管和行业规范的要求下,数据的价值实现和安全性陷入二元对立的状态。在这一背景下,隐私保护计算等新技术成为数据安全合规下互通互联的重要途径。9月17日,第四届全球智博会期间,业内首款编译器级隐私保护计算平台RealSecure发布,该平台能够在确保数据隐私保护的前提下促进数据流通,实现“数据不出库、模型多跑路”,以保护数据隐私和数据安全,为人工智能等创新应用提供更好的数据环境,更高效地挖掘数据价值。
数据通过流通共享与协同计算将更好地释放价值,随着人工智能等新技术的发展,数据本身的底层价值在快速井喷。瑞莱智慧合伙人朱萌分析,现有的数据流通模式面临三大困境,一是数据权属的不可分割导致数据拥有方不愿共享,二是针对数据安全的法律框架正全面构筑,监管日渐趋严,数据合规风险让企业机构不敢共享数据,三是技术不成熟与协议不统一导致数据仍无法实现互通互联,数据资产割裂、自成体系。应对这些痛点,其发布的RealSecure平台基于安全多方计算、联邦学习、可信执行环境等技术打造数据安全共享基础设施,通过将计算环节移动到数据端,实现“数据可用不可见”。
朱萌介绍,“数据不出库,模型多跑路”是该平台的核心功能,在数据不出本地、无中间方作为协调者的前提下,完成多方参与的模型训练并获得可投入生产的模型,既保障数据隐私安全,又以AI的方式驱动整个数据处理闭环。
【 算法|缓解数据安全与应用价值对立难题,隐私计算加速落地】隐私计算作为近年来的热门赛道,各类玩家纷纷入局。但从效果来看,隐私计算市场仍处于早期阶段,规模化的商业落地面临挑战。朱萌分析,隐私计算不同于传统机器学习,是分布式与可信芯片、密码学、人工智能三个领域的结合,在投入商用的过程涉及技术适配的工作,导致人力投入与代价较大。
“传统的做法可理解为’雕版印刷’,RealSecure实现的是’活字印刷’,兼容主流机器学习算法,只要调用函数,在编译器里重新编译一遍就可以。”朱萌解释,通过自研的隐私保护AI编译器架构,该平台能实现与传统算法的自动编译和一键适配将隐私保护计算算法公式解构成“算子”,基于算子的灵活组合来自动将普通机器学习算法程序转换为分布式的隐私安全程序,摆脱重复改写的繁琐工作。这可以让数据科学家以最熟悉的方式使用隐私计算,大幅提升易用性,加速隐私计算落地。
据毕马威预测,隐私计算国内市场规模将快速发展,三年后技术服务营收有望触达100到200亿人民币的空间,甚至撬动千亿级的数据平台运营收入空间。目前,隐私计算技术已广泛应用在金融风控、医疗、数字政务等众多领域。除瑞莱智慧外,华控清交、数牍科技、矩阵元、翼方健数等初创企业已纷纷布局隐私计算领域。