论文|《自然》:解放编辑双手,AI审查图像造假、学术不端( 二 )


此前,荷兰微生物学家伊丽莎白·比克(Elisabeth Bik)独立或合作发表了大约20000篇生物医学论文,2016年研究人员对这些论文中的图片进行人工分析后,结果显示有超4%的论文可能包含有问题的图片。然而,通常每年只有大约1%的论文得到更正,被撤回的则更少。
论文|《自然》:解放编辑双手,AI审查图像造假、学术不端
文章插图
荷兰微生物学家伊丽莎白·比克(Elisabeth Bik)
“我知道全球大约有20家公司在开发图像检查软件。”加州生物医学研究图像处理咨询公司Image Data Integrity总裁迈克·罗斯纳(Mike Rossner)说。
去年,全球部分科学出版商联合成立了一个工作组,为筛选图片问题的软件制定标准;该小组今年发布了关于编辑应该如何处理篡改图像的指导方针,但尚未制定软件的指导方针。
一些学术团体和公司告诉《自然》杂志,期刊和政府机构正在试用他们的人工智能软件,但Proofig是第一个公开客户信息的公司。除了AACR,美国临床调查学会在7月份开始使用Proofig的软件在《临床调查》杂志(JCI)上审查手稿,美国临床调查学会期刊的执行编辑莎拉·杰克逊(Sarah Jackson)说。伦敦独立学术出版公司SAGE的转型负责人海伦·金(Helen King)称,今年10月SAGE Publishing杂志在其五份生命科学期刊中采用了该软件。
Proofig的软件从论文中提取图像,并将它们成对地进行比较,以找出共同特征。一般而言,论文的检查时间大概在一两分钟内,Proofig的创始人德罗·科洛德金·加尔(Dror Kolodkin-Gal)说,该软件还可以纠正棘手的问题,例如将高分辨率原始数据压缩成较小文件时可能出现的压缩伪影。“计算机比人类视觉更有优势。”他说,“计算机不仅不会感到疲倦,运行速度也会更快,而且它也不会受到大小、位置、方向、重叠、部分复制和这些因素组合的影响。”
关于图片检查的成本,加尔拒绝详细讨论定价问题,但他表示与出版商签订的合同往往根据论文中的图像数量收费,同时也取决于手稿的数量。他说,这相当于每张纸的收费“接近几十美元而不是几百美元”。
杰克逊说,在《临床调查》杂志中,该软件发现的问题比以前工作人员手动审查的问题要多。虽然工作人员仍然需要检查Proofig的输出结果,但重要的是该期刊已经拥有处理各种图像问题的人工智能系统。“我们真的觉得严谨的数据是我们期刊的绝对标志。我们认为这值得花时间和金钱。”杰克逊说。同时,在美国癌症研究协会的期刊中,埃万科说许多作者很高兴在发表之前就发现了他们的图片重复错误。
三、AI+人工,多个出版商自研软件【 论文|《自然》:解放编辑双手,AI审查图像造假、学术不端】与此同时,位于瑞士洛桑的出版商Frontiers开发了自己的图像检查软件AIRA(人工智能审查助手),作为自动检查系统的一部分。一位发言人说,自2020年8月以来,一个研究图像完整性的团队一直在内部使用AIRA,用来对所有提交的手稿进行图像检查。但该软件标记的大多数论文实际上没有出现问题,仅有大约10%需要编辑团队跟进。Frontiers拒绝透露AIRA标记的论文数量。
包括比克和罗斯纳在内的图像完整性专家表示,他们自己还没有尝试过AIRA或Proofig,很难评估尚未使用标准化测试进行公开比较的软件产品。罗斯纳补充说,除了重复之外,检测是否通过PS删除或裁剪部分图像也很重要。“人工智能软件可能是视觉筛选的有用补充,但它可能无法替代当前形式。”
“不过,我相信这最终将成为稿件筛选的标准。”比克补充道。
尚未采用人工智能软件图像筛选的出版商提到了成本和可靠性问题。美国科学公共图书馆PLOS的一位发言人谈道,他正在“热切地”监控这项研究的进展情况,这些工具可以“可靠地识别常见的图像完整性问题并且可以大规模应用”。荷兰出版集团爱思唯尔(Elsevier)称,它们“仍在测试”软件,但它的一些期刊会在发表前筛选所有论文,并“使用软件工具和手动分析的组合”检查图像。