然而 , 风险也如影随形 。 从抖音侵犯用户信息权 , 到旷视科技等人脸识别公司被推至舆论焦点 , 到智联招聘用户简历流向黑市 , 到知乎4天获取3w+用户信息 , 再到美团被质疑差异化定价“杀熟”客户......经济利益的驱动下 , 用户个人信息在被各类主体竞相挖掘和利用的同时 , 因信息泄露引发的欺诈事件司空见惯、侵犯个人隐私的现象在多领域多平台泛滥 。
“善治病者必医其受病之处 , 善救弊者 , 必塞其起弊之原” 。 在大数据应用逐渐深入社会生产生活每一个“毛细血管”的今天 , 相关法律法规和监管政策对个人隐私保护筑起安全墙 , 企业也应积极采取相关措施 , 设置合规机制 , 注重技术安全升级 , 从根本上避开那些不该触碰的“雷” 。
02丨“可用不可见”的失效
很长一段时间 , 各大互联网公司都在积极探讨合理合法 , 保护用户隐私的数据使用方式 。
隐私计算或者说是隐私保护计算 , 此前被视为从技术角度实现了数据流通与隐私保护之间的平衡的最优解 , 即做到了数据的“可用不可见” , 既实现了数据价值的流通与共享 , 又实现了数据的隐私保护 。
很长一段时间 , “可用不可见”被视为隐私计算的精髓 。 “不可见”指的从技术角度屏蔽了敏感信息和隐私数据 , 为不可分享或者不能的数据加上一层安全的“防护罩” , 以实现事实上对隐私数据的保护 , 也就是不明文泄露、不直接明示 。
从这一角度来说 , “隐私计算”让数据开放、共享、流通成为一种可能 。 但需要注意的是 , “隐私计算”只解决了流通过程中的安全问题 , 在数据流通之前和之后的权属和收益问题仍不明确 , 另外“隐私计算”技术产品的安全分级标准与行业信任共识也有待建立 。
尤其是 , 通过密码学或者是分布式机器学习加密码的方式 , 来对于信息加密传输到中心再进行解密 , 解密过程和加密过程全部在计算机系统内完成 , 确实可以实现可用不可见 , 但实际处理过程中仍存在大量安全隐患 , 比如有的密文可以被反推出明文 。
西方世界知名的网络视频平台奈飞曾经就保护用户隐私做过一次算法的印证和比赛 。 当时奈飞公布了一部分做了去标识脱敏处理的用户评分 , 结果被UTAustin的两位研究者关联到了相应用户的ID , 并识别出了其中一些用户身份 。 2010年 Netflix为此被罚款900万美金 。 此前的2006年 , 为了学术研究 , “是美国在线”(AOL)公开了一些做了去标识和脱敏处理的匿名化的搜索记录 。 但是《纽约时报》通过这些记录 , 找到了真实世界中对应的一个人 。 后来AOL遭到起诉 , 为此赔偿了大概总额高达500万美金的罚款 。
这一过程中“可用不可见”带来的匿名化实现主要表现在个人身份识别信息(PII)的泄露 , 和个人的属性行为数据导致的个人身份泄露 。 由于某些个人属性行为数据的独特性 , 可以间接识别出特定自然人的身份 。
也就是说 , 在此案例中 , 数据还是要从用户自己持有的终端 , 例如手机上传到网站或者机构的服务器再进行后续计算的操作 , 这一过程数据会在一个开放空间中存在 , 那么只要掌握足够多的数据 , 就可以跟脱敏后的数据进行关联来查找相关性 , 最终可能会通过各种算法找到真正能对应的人 。
如此看来 , 只要数据脱离了消费者本身持有终端的掌控 , 就存在被泄露的风险 , 而这点是可用不可见的理论无法弥补的 。
03丨“可算不可识”更进一步
那么有没有真的能解决个人隐私安全 , 同时还能保证互联网企业算法为基础的业务模式继续推行的方法?
- 发现最小白矮星,其大小相当于月亮,这让科学家很兴奋
- 合规|上海制定反垄断、互联网营销算法、盲盒经营活动等新业态合规指引
- c语言|e观沧海丨算法焉能藏“算计”
- 任正非|假如美团外卖关闭了,对当今社会来说是利大于弊?还是弊大于利?
- 自动驾驶|华为首秀自动驾驶,王兴:特斯拉遇到技术与忽悠能力相当的对手了
- 腾讯|投出公司的总市值顶两个科创板,腾讯在给哪些企业当“后台”?
- 努比亚|16+512G存储,突然降了1500!有50倍变焦+5nm处理器,当真值得
- 马化腾|反垄断当前,小马哥见机行事:鹅厂只是一家普通公司,随时被取代
- 联想|司马南没告诉你们,当年联想的使命根本不是研发,而是赚钱养计算所
- 交汇点讯 近日|创新担当!紫金山实验室获两项全国级科技大奖