编程|互联网时代不懂数据脱敏是灾难性的

编程|互联网时代不懂数据脱敏是灾难性的

文章图片

编程|互联网时代不懂数据脱敏是灾难性的

文章图片

编程|互联网时代不懂数据脱敏是灾难性的

文章图片

编程|互联网时代不懂数据脱敏是灾难性的

数据脱敏(Data Masking)就是将身份证号、手机号码、卡号、客户姓名、客户地址、邮箱地址、薪资、登录密码、营业执照号码、交易金额、病例、工作履历等等特别敏感的信息通过脱敏规则进行数据变形 , 实现隐私数据可靠保护的一种手段 。 比如我们在某宝上购买东西的订单详情中 , 就会通过“*”的方式来遮挡商家账户信息 , 保障个人隐私不被泄露 。

当你经常收到各种会所、贷款、促销等等骚扰电话和短信的时候不用怀疑肯定是那个不道德的网站或者APP又把我们的个人信息给卖了 。 个人信息几乎爆料在整个网络上 , 个人隐私已经不隐私 , 所以网络隐私泄露大多数人已经躺平 , 几乎见怪不怪了 。

【编程|互联网时代不懂数据脱敏是灾难性的】如果担心隐私泄露那么完全可以不上网 , 不用手机 , 不用电话卡 , 不把钱存到银行里 , 不玩网络游戏 , 甚至不和其他人打交道 。 我相信几乎没有一个人能做到 , 每年都有无数重大数据泄露事件 , 造成了非常重大的损失 , 这类事件通常和黑客攻击、有组织犯罪、政治运动、国际竞争有关 , 当然也不少是因为员工疏忽、违规使用或处置存储介质导致数据泄露 。 想要保护隐私得依赖于立法和规则 。

数据脱敏可以有效保障隐私信息无效化政府、医疗行业、金融机构、移动运营商、互联网大厂等很早就已经开始应用数据脱敏了 , 因为他们掌握着大多数人最为核心的私密数据 , 如果泄露后果是不可估量的 。 所以我们现在最常见到的就是“*” , 但不仅仅局限于“*” , 比如美颜 , 视频中的马赛克 , 健康码通过普通软件扫不出身份证号码等都属于脱敏的手段 。

通过对某些数据值进行“截断”、“加密”、“隐藏”等方式使得敏感数据无效化是最为常见的数据脱敏收到 , 但缺点也非常明显 , 用户无法得知原始数据 。 普通软件扫描健康码是一串很乱的字符串 , 而通过专用的软件扫描却能显示用户的身份证信息 , 这种方式属于随机值替换 。 随机值替换可以很大程度上保留原有数据的格式又能让有心人和用户无法察觉 。

但在网络环境中不管如何抹去数据中心的敏感信息都需要保持原有的数据特征、业务规则和数据关联性 , 这样开发人员在开发、测试、数据分析等等环节才不会受到影响 , 确保数据脱敏前后的一致性和有效性 。 脱敏其实又没有那么简单 , 需要通过替换、无效化、乱序、加密等等方案进行脱敏改造 , 不管你怎么脱敏 , 最终不会影响用户使用才是最终结果 。 所以数据脱敏俨然已经成为了数据加密之上的一门学科 。

人人都要有数据脱敏的意识通过上面一大段文字描述“数据脱敏” , 很多人就会觉得数据脱敏只存在于网络环境 。 实际上网络环境下的私密信息也同样会体现在现实生活中 , 比如某人将数据库中的客户信息到处以明文的方式存在电脑里 , 被黑客窃取而泄密 , 又或者电脑拿去修而泄密 。 又比如我们的个人隐私通过快递单、外卖单等等泄露 。

所以每个人都要养成数据脱敏的意识 , 养成良好的数据脱敏习惯 , 才能保证有效地保护隐私信息不被泄露 。