先来问个问题|大数据正在揭露说谎的人( 三 )


先来问个问题|大数据正在揭露说谎的人
文章图片
同样 , 大数据分析对预测大选的投票率也比传统调研的方法要更准确 。 比如 , 传统调研调查投票率 , 会问选民“你是否会投票” , 这个数据不一定是准确的 。 但是在选举之前几周搜索“如何投票”或者“在哪儿投票”的人 , 最有可能真正在大选日去投票 。 一个地区这样的搜索越多 , 这个地区的投票率就越高 。
除了在大选中预测民意 , 大数据分析还能挑战一些常识 , 推翻我们固有的认知 。 看到一个问题时 , 我们经常用直觉去判断 , 但是大数据告诉我们 , 很多直觉不靠谱 。
先举一个美国“吃瓜群众”的常识 。 很多美国人认为 , 穷人更容易入选NBA , 也就是美国男子职业篮球联赛 , 特别是黑人的孩子 , 因为在NBA球员里 , 黑人的比例非常大 。 这种传统的想法认为 , NBA给了穷人家的孩子一条出人头地的出路 , 因此穷人家的孩子会特别努力 , 肯吃苦 , 而中产家庭的孩子缺乏这样的努力与吃苦精神 。
先来问个问题|大数据正在揭露说谎的人
文章图片
现实是这样么?对过去几十年所有NBA选手的家世背景的大数据分析显示 , 恰恰是中产家庭的孩子更有可能参加NBA选秀 。 因为首先 , NBA需要个子高的球员 , 而家境比较好的孩子更容易长高 , 那些吃救济、单亲家庭的孩子很可能成长阶段营养不够 , 不容易长高 。 其次 , NBA不仅需要高个子和体能 , 也需要团队配合能力 , 需要比较高的情商 。 而美国的穷人很可能生长在单亲家庭 , 缺乏情商教育 , 不合群 。 现实很残酷 。 “吃瓜群众”对苦孩子“能吃苦更努力”的一厢情愿 , 在大数据面前不堪一击 。
再举一个教育方面的例子 。 我们知道 , 有个群体叫虎妈 , 也就是严格管教孩子 , 要求孩子考名校的妈妈们 。 虎妈们有一种常识——高中进名校是未来进好大学、找到好工作的敲门砖 。 纽约就有这么一所特别著名特别难进的公立高中 , 能上这所高中 , 基本上就等于拿到了进入常春藤大学的录取通知书 , 也拥有了进入上层中产的入门券 。
先来问个问题|大数据正在揭露说谎的人
文章图片
大数据的研究者就问了 , 到底是学校优秀让学生可以有更多机会 , 塑造了孩子的未来 , 还是在激烈竞争里脱颖而出的学生本身就很优秀?大数据给了解答这一问题的机会 , 因为这所高中的录取完全看分数 , 有人恰巧超过了分数线 , 就被录取了 , 有人却因为一两分的差距而落榜 。 研究者对比在分数线上下差别不大的两组人未来的发展情况 , 发现是否进入顶级高中对于这两组人的未来没有太大的影响 , 决定一个人未来最大的因素是他的才智和冲劲 。 这个研究结果让虎妈们大跌眼镜 。
第三部分 。
那么下面 , 我就来为你讲述最后一个重点:当我们有了海量数据之后 , 可以更精准地对特定地区和特定人群做出分析 , 我们甚至有机会精准地对某个特定的人进行画像 。 换句话说 , 未来可以利用大数据做到各种各样的“私人定制” 。 这听起来到底是好事还是坏事?
其实自从大数据产生第一天起 , 对大数据被“滥用”的风险 , 以及在数字时代如何保护个人的隐私 , 就不断被提醒 。 利用大数据研究来预测未来 , 一旦涉及到特定的个人的时候 , 一定要慎之又慎 。
举一个可能造福所有人的例子 。 未来医学发展中利用大数据的一个重要发展领域就是 , 找到一个病史记录上跟你的身体信息类似的人 , 或者跟你的某种身体体征类似的人 , 比如说血脂和血糖水平、家族心血管疾病病史 , 当然也包括特定的基因等等 , 这在大数据时代很快就会成为可能 。 这可以定义为每个人的数据分身 , 或者说数据影子 。 这么做的好处很多 。 医生可以根据你的数据分身的病史记录 , 预测你未来接受治疗的反应 , 并可能提出更稳妥的诊疗方案 , 真正做到医疗的私人定制 。