|陈根:AI问诊变成“抛硬币”,人工智能还能信吗?

|陈根:AI问诊变成“抛硬币”,人工智能还能信吗?

文/陈根
AI问诊被认为是人工智能在医疗领域最具前景的应用 , 但近日 , 科学家们却对AI问诊提出了质疑 。
具体来看 , 在医疗领域 , AI用于诊断检测人体一直质疑声不断 , 基于此 , 哈佛医学院的数据科学家Kun-Hsing Yu选定了AI肺癌筛查来进行研究 。
实际上 , AI肺癌筛查一直以来都备受机器学习界关注 , 为此 , 2017年业内还举办了面向肺癌筛查的竞赛 。 该活动归属于Kaggle的Data Science Bowl赛事 , 数据由主办方提供 , 涵盖1397位患者的胸部CT扫描数据 。 参赛团队需开发并测试算法 , 最终大赛按准确率给予评奖 , 在官宣中 , 至少五个获奖模型准确度90%以上 。 但Kun-Hsing Yu又重新测试了一轮 , 然后震惊地发现 , 即便使用原比赛数据的子集 , 这些“获奖”模型最高准确率却下降到了60-70% 。
除了Kun-Hsing Yu外 , 普林斯顿一位博士 , Sayash Kapoor , 在17个领域的329项研究中也报告了可重复性失败和陷阱 , 医学名列其中 。

基于研究 , Sayash Kapoor博士及自己的教授还组织了一个研讨会 , 吸引了30个国家600名科研者参与 。 一位剑桥的高级研究员在现场表示 , 他用机器学习技术预测新冠传播流行趋势 , 但因不同来源的数据偏差、训练方法等问题 , 没有一次模型预测准确 。
这也让我们看到当前人工智能仍然存在的问题 , 就是不够成熟 。 实际上 , 这也是普遍的人工智能应用所存在的问题:由于部分人工智能企业及媒体传播的夸大 , 导致了人工智能仍然青涩的能力在某些领域存在被夸大的情况 。
其一 , 是由于部分人工智能企业及媒体传播的夸大 , 导致了人工智能仍然青涩的能力在某些领域存在被夸大的情况 。 其二 , 是当前的人工智能高度依赖数据 , 但数据积累、共享和应用的生态仍然比较初级 , 这直接阻碍着人工智能部分应用的实现 。 其三 , 人工智能作为一种新的技术 , 在市场的应用无疑需要长期与实体世界和商业社会进行磨合 , 避免意外的情况发生 。
【|陈根:AI问诊变成“抛硬币”,人工智能还能信吗?】人工智能掀起的技术革命成为不争的事实 , 但对于人工智能的发展仍然需要合理的期待 , 否则就会像AI问诊的结果一样 , 变成“抛硬币”的随机事件 。