传染病|翼方健数张霖涛:隐私安全计算如何助力形成数据和计算互联网( 三 )


接着介绍一下我们的理念,也即 IoDC 的愿景。XDP 翼数坊实际上是个单体平台,它是云的部署,比如部署在公有云或者私有云上。这就是所谓「机构性的平台」,当机构互相之间产生一定的信任时,一个或者多个机构可以把数据放在这个单体平台上,统一管理。各个机构信任这个平台,通过授权和加密的方法保证数据的安全,在授权下进行使用。
但是单体平台是不够的,所以我们有「平台联盟」这个概念。当有很多这样的机构,比如很多医院,每个医院单独建立一个平台。当每个医院部署这样的平台以后,他们就可以通过专属的高效私有协议实现一个联盟。实现联盟之后,平台之间的信任相对来说就会降低,但是这取决于各个平台之间的互相信任,并且由平台管理员决定。在这种情况下,用户可以采用更低廉的方法来做安全计算。平台联盟通过隐私计算的方法,在保证数据安全的前提下获取价值。
当然数据不可能都放在这个XDP平台里面,我们的愿景就是「数据和计算的互联网」。这个愿景就是很多数据平台达成一种共同协议、说同样语言的时候,那么在数据平台之间,即使没有信任,他们也能在获取授权的情况下参与共同计算。这时候,不同的平台之间就可以实现计算和数据的互联互通。这就像是互联网,虽然不是一个厂商制造的,但是只要使用相同的 TCP/IP 协议,就可以互相通讯。同样的道理,不同的平台之间可以在计算和数据方面形成一个互联网。
传染病|翼方健数张霖涛:隐私安全计算如何助力形成数据和计算互联网
文章插图

案例:基于隐私安全计算的传染病多点触发监测和智能预警平台
接下来跟大家分享一个具体的案例:一个城市级别的传染病多点触发和智能预警系统。这个系统很复杂,除了本身云端的一些工作之外,还有一些端方面的应用,比如哨点插件等会显示在医生终端。
传染病|翼方健数张霖涛:隐私安全计算如何助力形成数据和计算互联网
文章插图

这个系统跟人工智能有什么关系呢?我们是用人工智能模型来做传染病传播的预测。过去有很多预测传染病的方式,最常见的是疾病动力学的模型,把人归为几种类型,比如传染人群、健康人群和恢复人群。这类模型涉及一些参数,比如传染病的发病率和恢复率等。有了这些参数之后,我们就可以建立一个基于偏微分方程模型,也就可以利用这个模型预测传染病将来的发生。大家可能听说过一些名词,比如传染病的R0值,它就是疾病动力学模型中的一个重要参数。
现在深度学习能够处理更多的模型。因此,我们思考能不能利用人工智能和深度学习来做疾病的预测呢?我们和合作伙伴使用时空图卷积网络模型来做传染病预测。
传染病|翼方健数张霖涛:隐私安全计算如何助力形成数据和计算互联网
文章插图

大家知道神经网络需要使用很多数据,那么哪些数据会对疾病预测有意义呢?医疗健康数据是很重要的一点,比如医院里检测到多少人发烧和多少人生病,这些都很重要。除此之外,很多其他的数据对传染病的预测也非常重要,比如说药品销售。一个人生了病,他会跑到药店,先买退烧药,并没有去医院,这些数据就不会反映在医院的病人里。药店的数据存在什么地方呢?在政府医保局里面,因为买了药之后很多情况下需要报销。家庭信息也很重要,比如一对夫妻以及他们的子女都得了病,那么就可能是传染病。为了得到这些信息,需要他们的家庭关系以及居住地址,这些需要从民政局获取。同样地,如果同学聚集在一起并且好几个人都得了病,这也可能是传染病,这些信息需要从教育局获取。另外还有其他一些数据,比如天气、温度等公共数据,这些对于感冒有很大的影响。还有河流水量水文数据,这些对血吸虫等疾病有很大影响。还有搜索公司的一些数据,比如很多人生了病之后会到网站上搜自己发烧的原因等。最后还有人口迁移,病人迁移到其它地方,会将传染病带过去。总之,非常多的数据会影响疾控的预测,这些数据都分布在不同的地方。