|陈根：AI问诊变成“抛硬币”，人工智能还能信吗？

文/陈根
AI问诊被认为是人工智能在医疗领域最具前景的应用，但近日，科学家们却对AI问诊提出了质疑。
具体来看，在医疗领域， AI用于诊断检测人体一直质疑声不断，基于此，哈佛医学院的数据科学家Kun-Hsing Yu选定了AI肺癌筛查来进行研究。
实际上， AI肺癌筛查一直以来都备受机器学习界关注，为此， 2017年业内还举办了面向肺癌筛查的竞赛。该活动归属于Kaggle的Data Science Bowl赛事，数据由主办方提供，涵盖1397位患者的胸部CT扫描数据。参赛团队需开发并测试算法，最终大赛按准确率给予评奖，在官宣中，至少五个获奖模型准确度90%以上。但Kun-Hsing Yu又重新测试了一轮，然后震惊地发现，即便使用原比赛数据的子集，这些“获奖”模型最高准确率却下降到了60-70% 。
除了Kun-Hsing Yu外，普林斯顿一位博士， Sayash Kapoor ，在17个领域的329项研究中也报告了可重复性失败和陷阱，医学名列其中。

基于研究， Sayash Kapoor博士及自己的教授还组织了一个研讨会，吸引了30个国家600名科研者参与。一位剑桥的高级研究员在现场表示，他用机器学习技术预测新冠传播流行趋势，但因不同来源的数据偏差、训练方法等问题，没有一次模型预测准确。
这也让我们看到当前人工智能仍然存在的问题，就是不够成熟。实际上，这也是普遍的人工智能应用所存在的问题：由于部分人工智能企业及媒体传播的夸大，导致了人工智能仍然青涩的能力在某些领域存在被夸大的情况。
其一，是由于部分人工智能企业及媒体传播的夸大，导致了人工智能仍然青涩的能力在某些领域存在被夸大的情况。其二，是当前的人工智能高度依赖数据，但数据积累、共享和应用的生态仍然比较初级，这直接阻碍着人工智能部分应用的实现。其三，人工智能作为一种新的技术，在市场的应用无疑需要长期与实体世界和商业社会进行磨合，避免意外的情况发生。
【|陈根：AI问诊变成“抛硬币”，人工智能还能信吗？】人工智能掀起的技术革命成为不争的事实，但对于人工智能的发展仍然需要合理的期待，否则就会像AI问诊的结果一样，变成“抛硬币”的随机事件。