传统文化|中英文翻译算什么,微软的AI居然连汉语文言文都能互译了

遇到看不懂的英文句子,我们可以随手找个翻译软件翻译或者直接在搜索引擎里翻译,而如果你碰到了一句看不懂的文言文,有没有能翻译的软件呢?还真有,这就是最新的人工智能,而且是微软亚洲研究院推出的。
【 传统文化|中英文翻译算什么,微软的AI居然连汉语文言文都能互译了】
可能我们很多人都不知道。平常我们在线中英文翻译,多数往往看到用到的是Chinese中文简体中文繁体,英文这些,其下选项则是阿尔巴尼亚语,阿拉伯语诸如此类。很多朋友以为往下一大串都是外国语。不过在最低部还藏着一个Chinese,那就是Chinese(Literary)看名字不就是中文吗,有啥区别呢?这个,就是文言文。
传统文化|中英文翻译算什么,微软的AI居然连汉语文言文都能互译了
文章插图

目前人工智能训练数据,往往需要大得吓人的数据(还是一点点处理好的高质量数据)和贵得吓人的硬件显卡。而这个先天特性,又恰恰是文言文的不足。毕竟不管是文言文本身的体量,还是我们对文言文的了解,相对AI的“欲求不满”而言都显得很少。而且还有时代发展导致的语言新问题,比如近几十年我们国内高速发展带来的新名词,计算机技术发展诞生的新概念,都对现代汉语/文言文的翻译带来了困难(更遑论微博论坛里一些非正规的文体)。所以研究人员做了很多工作。

最终完成了这个现代汉语/文言文的互译,也就是简体中文/古汉语的互相翻译。机智客试了几个,嗯哼,有点意思吖。即便如此强大完善了,基于当前的翻译系统,微软依然还将在丰富数据集、改进模型训练方法上不断精进,使方法变得更加鲁棒、通用,未来或许不只是在文言文翻译中能够使用,还可以扩展到更多应用场景中。

其实吧,刚知道微软这个最新的神经网络机器翻译模型和训练框架,机智客个人的第一个感觉是,我们国内的人工智能有类似这样宣传古文传统文化的人工智能程序不?为嘛传统文化这块,国外的研究所依然先于国内呢?嗯,可能思想的确有点狭隘。姑且莫论,微软这个神经网络程序的确不错,让我们很多人能领略到中国传统文字带来的文化魅力。从另一方面讲,我们在这块土地上繁衍生息,文化传承了几千年,肯定更能懂我们自己的文化,当AI等技术更进一步普及开来,我们可能具备更多的本土优势来融合来突破。
?