非同质|技术非中立,语言非同质:机器翻译正被用于维护文化障碍( 三 )


非同质|技术非中立,语言非同质:机器翻译正被用于维护文化障碍
文章插图
Franz Och, with a copy of the Rosetta Stone. Source: New York Times
当年,Page联系了当时在南加州大学信息科学研究所担任研究科学家的弗Franz Och,聘请他建立后来的谷歌翻译。Och起初持怀疑态度,对一家搜索引擎公司为何要涉足翻译领域感到困惑,但谷歌用前所未有的计算资源来推动机器翻译的前沿性发展吸引了他,而谷歌所掌握的绝对数量的文本数据使之成为新的突破口。
在接下来的几年里,在奥奇Och的指导下,谷歌翻译超过了大学研究小组的其他机器翻译的工作,为数十种语言开发了高效的系统。2010年,在美国国家标准与技术研究院主持机器翻译评估竞赛的Mark Przybocki将谷歌的竞争优势比作“与拥有一个足球场大小的处理器来收集数据的人进行对抗”。如今,谷歌翻译拥有在一百多种语言之间翻译文本的能力,微软和Facebook等其他科技巨头也纷纷涉足机器翻译研究。

3

机器翻译的使用和滥用
推动机器翻译发展的是对未知语境资源的强烈追求。美国机器翻译的最早努力是为了破译冷战时期的俄罗斯通信和科学论文,而现在,谷歌已经部署了其最先进的机器翻译工具来构建其庞大的世界在线内容数据库。虽然普通用户通过使用谷歌翻译得到了便利,但这些免费的工具可以被理解为“钩子”,使用户进一步陷入监视资本主义的抽象化关系中,并“将经济活动转移到作为翻译提供者的少数科技巨头身上”。
虽然享受到机器翻译福利的主要政府强调是通过该项技术来实现相互理解以“维护和平”,而谷歌则将其翻译服务宣传为“打破语言障碍和使世界更易接近”的工具。
这种语言作为“障碍”的意象在关于机器翻译的讨论中经常被引用,为这些障碍被打破后的普遍理解提供了一个乌托邦式的观点。颇具讽刺意味的是,正如美国国土安全部的社交媒体审查程序所显示的那样,翻译软件是被专门用来维护文化障碍的,只是增加了一个划分“内”和“外”群体的技术工具库。
非同质|技术非中立,语言非同质:机器翻译正被用于维护文化障碍
文章插图
Source: Evaluating Gender Bias in Machine Translation
使问题更加复杂的是,对许多语言来说神经系统机器翻译输出的貌似流畅的语言可以掩盖事实,即系统仍然难以产生准确的翻译,可以放大社会偏见,并容易在翻译重要意义时出现不准确,比如否定意义。
机器翻译技术在高危场景下被频繁使用尤其危险,例如在警察和平民之间的案件调查中,我们必须警惕在应用概率法试图让人们看清楚真相,却掩盖或歪曲了事实,翻译也不例外。与此同时,我们还必须注意诸如警察与平民办案等场景一开始就变得如此高风险的条件——更精确的翻译系统不会有意识地打破社会的权力失衡,我们也不应该假装它们会。
由于本文是在全球COVID-19大流行的情况下起草的,我们不能忽视翻译在交流和传播有关预防、试验和寻求治疗最佳方法的重要信息方面所发挥的关键作用。越来越依赖自动翻译从国际科学知识生态系统中拾遗补缺,这促使人们呼吁学者们发展“机器翻译素养”,以了解自动翻译学术文本的缺陷。技术专家、政策制定者和受影响的利益相关者在界定机器翻译的适当用途时,必须考虑机器翻译的局限性。
4

对机器翻译的反思和重塑
“语言不是可以被定位或重新定位的有形物体,这一事实使文化所有权问题比具体的艺术品或其他文化对象更微妙,但也更迫切”