农企新闻网

谷歌翻译无法取代人工翻译,这是它的实质决议的

发布者:李悦明
导读【腾讯科技编者按】《大西洋月刊》近日宣布认知迷信家、言语喜好者、翻译家道格拉斯·霍夫萨达特(Douglas Hofstadter)的文章,称谷歌翻译运用的虽然是最先进的人工智能(AI)技术,但测试标明,它翻译言语的程度间隔取代人工翻译还差得远。以下为原文内容:我最后对机器翻译感兴味是在1970年代中期。近来,由于“深层神经网络”的运用进步了机器翻译的质量,一些人以为,机器翻译在数年内就会取代人工翻

谷歌翻译无法取代人工翻译,这是它的本质决定的

【腾讯科技编者按】《大西洋月刊》近日宣布认知迷信家、言语喜好者、翻译家道格拉斯·霍夫萨达特(Douglas Hofstadter)的文章,称谷歌翻译运用的虽然是最先进的人工智能(AI)技术,但测试标明,它翻译言语的程度间隔取代人工翻译还差得远。以下为原文内容:

我最后对机器翻译感兴味是在1970年代中期。近来,由于“深层神经网络”的运用进步了机器翻译的质量,一些人以为,机器翻译在数年内就会取代人工翻译,而翻译人员将会变成质量控制人员和毛病修复人员。

谷歌翻译的实质就是绕开对言语的“了解”

谷歌翻译可以很迅速地把A言语翻译为B言语。有人以为,假如一个软件可以如此流利地对文字停止处置,那么这个软件一定晓得这些文字的意思。这种与AI顺序有关的经典幻觉被称为“伊丽莎效应”(eliza effect),由于早在20世纪60年代,就有一个名为伊丽莎的短语生成器伪装故意理医治师,令很多与之互动的人发生了诡异的觉得,仿佛伊丽莎能深入天文解了他们内心感受似的。

几十年来,很多聪明人都被伊丽莎效应困住了,就连一些AI研讨人员也是如此。谷歌翻译这样的软件其实并不了解词语的意思,不只如此,谷歌翻译的实质就是绕开对言语的了解。

人类是怎样翻译文章的

对我而言,“翻译”这个词分发着奥秘而令人回味的光环。它代表了一种深入的兽性化艺术方式,是将A言语中的思想明晰优雅地转换成B言语中的明晰思想。翻译不只要做到明晰,还应该坚持原作的原汁原味。每当我翻译的时分,我都会先细心阅读原文,尽能够明晰天文解含义,让它们在我脑海中回荡。让原作中的内容触发各种相关想法的意念,在我脑海中发明出相关场景的丰厚“光环”。不必说,这种光环大局部是有意识的。但只要当我的脑海里充溢了这种光环时,我才开端尝试用第二种言语来表述它。

简而言之,我并不是复杂地把A言语中的单词和短语转换为B言语中的单词和短语。而是在有意识中构建出图像、场近一年来,国家加大了对于互联网金融的管理力度,各种管理政策不断出台,不少业内人士对于互联网金融都保持着谨慎看好的态度,但是安方丹却保持了乐观的态度,她认为,互联网金融行业在当前是“风口上的大象”,技术正是这股风的原动力。景和想法,并用我本人已经阅读过的,或在电影中看到,或从冤家那里听到的阅历来领悟它,只要当这种非言语的、抽象的、体验上的、肉体上的“光环”呈现——只要当原作含义的泡沫飘浮于我的大脑中时——我才开端输入目的言语中的单词和短语,然后修正,修正,再修正。这个以含义为媒介的进程听起来能够不够酷炫,毕竟谷歌翻译每两秒就能翻译一大页,但是任何严肃的翻译人员都是这么做的。

实验用谷歌翻译汉译英

我用谷歌的软件来把几段法文和德文翻译成英文,后果有不少错误。而当我试图用它把中文翻译成英文时,发现效果更糟。我选择的是杨绛在回想录中写的几段话。

“锺书到清华任务一年后,调任毛选翻译委员会的任务,住在城里,周末回校。 他仍兼管研讨生。

毛选翻译委员会的指导是徐永煐同志。引见锺书做这份任务的是清华同窗乔冠华同志。

事定之日,晚饭后,有一位旧友特雇黄包车从城里赶来恭喜。客去后,锺书惶恐地对我说:

他以为我要做“南书房行走”了。这件事不是好做的,不求有功,但求无过。

谷歌翻译成的英文有些怪异,首先没有提到“锺书”这个名字,要么直接运用代词he,要么翻译成book。

而且谷歌翻译说锺书是研讨生,明明原文写的是他在兼管研讨生。

“毛选翻译委员会”也没有翻译对。

“永煐”则变成了“Yongjian”。

至于“南书房行走”,谷歌翻译把它直接翻译成了 “South study walking.”。

(南书房行走,又称南书房翰林。为中国清朝的官衔之一,不属于正式官职,普通由事先的御用知识份子翰林来担任。)

总而言之,谷歌翻译出来的英文虽然都由英语单词组成的,但却不够真正地传达含义,所以你不能说它是英文,它只是英文词语的大杂烩。

有些人能够会觉得我为了挑刺,成心选了一些十分难懂的段落来做实验,实践在绝大少数的段落中,谷歌翻译的效果更好。虽然这听起来仿佛是那么回事,但状况并非如此。我把我正在读的书中任何一段输出出来,输入的后果都会有大大小小的翻译错误,包括下面例子中那样莫名巧妙的错误。

当然,我也供认谷歌翻译有时会输入一系列看上去很像样的句子(虽然它们能够是误导性的,或完全是错的)。这给你一种错觉,让你觉得谷歌翻译很凶猛。不得不说的是,以机器的规范来权衡,它的翻译效果似乎的确还不错。但与此同时,不要遗忘伊丽莎效应。谷歌翻译引擎并不是在“阅读”文本,只是在“处置”文本。这个进程与理想经历是分开的,没有记忆,没有意象,没有了解,没有含义。

扩展数据库并不能处理成绩

一位冤家问我:假如把谷歌翻译的数据库扩展一百万甚至十亿倍,它可以根本完满地翻译任何东西吗?我不这么以为。拥有更多的“大数据移动互联网在带来全新社交体验的同时,也或多或少使人们产生了依赖。移动互联网使网络、智能终端、数字技术等新技术得到整合,建立了新的产业生态链,催生全新文化产业形态。”不会让你了解内容的含义,这个进程触及到思想,而缺乏思想是当今机器翻译一切成绩的本源。所以我觉得,更大的数据库并不是处理成绩的关键。

还有人问,谷歌翻译能否可以运用神经网络,让机器开端真正了解言语。这听起来似乎很有出路,但它依然不是在尝试逾越“单词和短语”这个层面。庞大数据库中的各种统计现实都可以表现在神经网络中,但是这些统计数据仅仅是将一个单词与其他单词联络起来,而不是将一个单词与概念联络起来。各种可以被以为是想法、图像、记忆或经历的心思进程,从计算的角度来说依然是太难捉摸,因而人们用疾速而复杂的统计词会聚类算法来替代它。但是,这种替代品提供的后果,却无法和真正阅读、了解、发明、修正并判别一篇文章的后果相媲美。

虽然如此,谷歌翻译的确为很多人提供了称心的效劳:由于只需它翻译的后果中有一局部是可以看懂的,用户就会感到称心了。我团体并不觉得这算是“翻译”,但是对一些人来说,这真的是很好的效劳,对他们来说,这就是翻译。他们的要求是这样的,只需到达这个要求,他们就会称心。

假如机器可以重现人类智能

多年以来,我一直以为人脑是一台机器,是一种十分复杂的机器,而且我激烈支持那些说机器实质上不能处置含义的看法。有一些哲学家宣称,计算机永远不会“有语义”,由于它们是由“错误的东西”(硅)构成的。我觉得这么说太轻率了。有些读者能够觉得我在本文中就是这个意思。但其实我的意思是,科技并没有试图重现人类智能,而是试图绕过人类智能,后果不如人愿。

我觉得,机器有朝一日能够会拥有创意、兴趣、复古感、冲动、恐惧、狂喜,因而能够高程度地停止翻译。但是,只要当机器像人一样充溢想法、情感和经历时才会呈现这样的状况。这一天应该还十分悠远,不过至多我怀有这样的等待。

假如有一天,某个翻译引擎用英语创作出一部文艺小说,充溢妙语、情感和声律,那我就真的对它心悦诚服了。(编译/Kathy)