农企新闻网

AI翻译难以到达专业翻译水准,缘由何在?

发布者:高悦林
导读图片来源:视觉中国明天是韩国平昌冬奥会的第二个竞赛日,就在冬奥会举行前夕,谷歌翻译闹出了一桩和冬奥会有关的笑话。据BBC网站音讯称,挪威代表队的主厨希望购置1500个鸡蛋,他将相关语句输出谷歌翻译效劳,后果韩国本地的超市给送来了15000个鸡蛋。显然,是谷歌翻译效劳在两头环节出了成绩。不过如今尚不知精确缘由,而且BBC以为,韩文中独有的计数体系以及挪威代表队厨师的拼写也能够是形成成绩的缘由。此事目

AI翻译难以达到专业翻译水准,原因何在?

图片来源:视觉中国

明天是韩国平昌冬奥会的第二个竞赛日,就在冬奥会举行前夕,谷歌翻译闹出了一桩和冬奥会有关的笑话。据BBC网站音讯称,挪威代表队的主厨希望购置1500个鸡蛋,他将相关语句输出谷歌翻译效劳,后果韩国本地的超市给送来了15000个鸡蛋。

显然,是谷歌翻译效劳在两头环节出了成绩。不过如今尚不知精确缘由,而且BBC以为,韩文中独有的计数体系以及挪威代表队厨师的拼写也能够是形成成绩的缘由。此事目前尚无法断定,但从正面反映出翻译软件效劳能够存在一些成绩。

近年来随着互联网与智能手机的开展,在线翻译的普及度也越来越高。随着市场和技术的进一步开展,入局在线翻译的企业添加,尤其是关于先进技术的吸纳,使得技术也渐趋成熟。但在开展的同时,也难免会存在缺陷和疏漏。

一、巨头争相规划翻译市场,AI翻译技术日趋成熟

去年,AI技术为各界津津有味,不管是群众、厂商还是各行各业,都对其发生了绝后的兴味。作为古代科技中足以引领潮流的技术,也引得众多行业中的大佬纷繁入局。谷歌、苹果、微软、百度、阿里、腾讯都在加紧发布自家的AI翻译软件产品。

AI翻译难以达到专业翻译水准,原因何在?

虽然机器翻译的呈现已无数十年的工夫,但在过来几年间涌现出的AI软硬件翻译产品数量成倍增长,远超出了之前那些年呈现的翻译产品。

国外,微软于2016年发布了翻译工具Microsoft Translator,这是全球首款真正意义上的“万能翻译器”。该产品最大的亮点在于,可以经过对底层深度神经网络技术的使用,完成准确的语音辨认和翻译。Microsoft Translator的辨认与翻译局部采用了ResNet深度神经网络与临时短期记忆技术,而ResNet神经网络深度则高达150层。

谷歌的翻译软件似乎更受喜爱一些,多年的搜索引擎历程使其积聚的少量的数据与经历。大约在2014年左右,有关在机器翻译中使用深度学习的论文开端少量呈现。谷歌依据这些实际效果,对自家的翻译软件停止屡次改良以提升其精确度。

谷歌自身拥有少量的机器集群,在这些集群上部署神经网络训练义务绝对而言就十分容易了。只需指定所需资源,就能将训练义务加以部署,从而最大限制地缩减研讨本为数亿中文用户免费提供海量、全面、及时的百科信息,并通过全新的维基平台不断改善用户对信息的创作、获取和共享方式。钱。这可以使研讨者从这类事情中束缚出来,愈加专心努力于网络构造方面的研讨,并且可以让他们去停止少量的实验,用以验证其想法,这使得谷歌的翻译产品提高减速。

国外市场如火如荼,国际的情形也与之相差无几。

去年9月,百度在日本发布了智能翻译机。可在中英、中日等多种言语互译形式中流利辨认一键翻译,还能为手机、电脑等设备提供WIFI,且自带80余个国度的挪动数据流量,自动衔接4G网络。

同年,腾讯也推出了一款名为“翻译君”的翻译软件。该软件驱动内核为AI,采用NMT(神经网络机器翻译)+语音辨认等先进技术,可以完成同声传译功用,且支持在手机等挪动终端的使用及实时会话翻译等外容。

去年,不断在语音交互方面有深化研讨的科大讯飞推出了智能翻译产品“晓译翻译机”。内置语音辨认技术,配合运算芯片可完成中英离线互译,也能做到不受网络环境限制。

AI翻译难以达到专业翻译水准,原因何在?

甚至连电商也开端涉足AI翻译范畴。去年8月,京东推出了一款可停止多国言语实时翻译的“准儿翻译机”。

互联网企业纷繁入局,可看到AI翻译范畴的火爆水平。在技术上,各家企业也有所提升。

例如近年来,NMT(神经网络机器翻译)技术炽热,它可以模拟人脑神经考虑的形式,产出高质量的译文,并将误差降低55%~85%。谷歌将其使用于网页翻译与手机,百度、阿里、腾讯等互联网企业也将深度学习的理念参加机器翻译中。

此外,言语的处置、语音交互等技术的开展使得翻译产品的场景晋级减速,也让翻译产品从CAT(辅佐翻译)的阶段过渡到了AI Interactive Translation(人工智能交互翻译)的阶段。当今各类技术层出不穷,本质上AI处置人类言语大致可分为基于规则的机器翻译、基于实例的机器翻译和统计的翻译三品种型,目前谷歌等公司采用的根本上是最初一种。

从全球AI翻译市场来看,技术到达一个较为成熟的形态。随着全球各方面交流的加大,将来翻译市场的需求将继续出现指数级增长速率,估计全球机器翻译市场将在2019年增长至69亿美元。

但是任何行业和技术在开展进程中,都不可防止地会呈现一些缺陷与疏漏,AI翻译市场也异样不例外。

二、到达专业翻译水准,AI翻译依然缺乏足够数据支撑

在翻译程度方面,AI翻译还难以到达令人非常称心的水平,甚至在翻译进程中闹出过许多笑话。

去年,一名巴勒斯坦人遭到以色列警方拘捕。缘由可谓非常“乌龙”:他在Facebook上用阿拉伯文发了一条内容为“早上好”的帖子。后果由于翻译软件的错误,内容变为“攻击他们”。

AI翻译难以达到专业翻译水准,原因何在?

在翻译软件呈现的成绩方面,最典型的例子是“苹果式中文”,因其常常毁坏性地发明中文语序读法而饱受吐槽。如“开发者的大事,大快一切人心的大坏事”、“真的笑,笑出声”等糟糕的翻译方式常常呈现在苹果的产品中。

由此看来,虽然AI翻译技术大幅提升,但与高程度翻译所要求的“信、达、雅”之间还存在相当大的间隔。对人类而言,需求的绝不只仅是逐字逐句的字面翻译,还要表现出语调、情感,甚至是神韵。

想要传达出这些,需求翻译者有一定的敏感度、水准以及境界。目前AI技术虽已开展到一定水平,但关于这些要求尚不可到达。假如真的想要到达“信、达、雅”的高度,AI要克制人类口语化的难题,如语音断句、语法差别等。

那么机器终究经过怎样的办法才干处理这些成绩?其实AI翻译的难点也是整个行业面临的难点,那就是如何使AI像真正的人类一样拥有智能行为。AI翻译的精确水平实践上取决于数据。目前的翻译体系中多是来自官方的文档,但短少文娱、体育方面的数据。加之各地口语中随意性较大并存在网络用语,所以AI翻译仍需庞大的词汇库加以支撑。

实际下去看,一切的成绩都能经过庞大的数据来处理,但短期之内,AI翻译的数据支撑依然处于严重缺乏形态。

此外,传统翻译行业对AI翻译也颇有微词。有观念以为,不管是翻译机还是翻译软件,由中文翻译成其他言语之时效果尚可,但由其他言语翻译过去精确率则不高,在实践交流中更是难以使用。

去年2月,谷歌全新的NMT零碎在韩国世宗大学与人类译员停止的翻译对战。在50分钟内单方同时翻译两段文本。后果NMT不占丝毫优势,并且评委指出NMT零碎翻译出的文本九成都存在语法方面的成绩。

AI翻译难以达到专业翻译水准,原因何在?

随着技术的完善与提高,将来的AI将可以完成大局部的复杂翻译要求。但关于多元化、纤细化的专业翻译需求,AI又能否完成呢?其实,世界上的言语多达上千种,而绝大少数的言语还缺乏足够的材料,所以需求不时地去积聚。

此外,AI翻触及到多种知识,如言语学、计算机迷信、数学及神经认知迷信。所以AI翻译是一个相当复杂的范畴。因而想要真正完成AI翻译效劳的使用,还需求相当长工夫的开展与完善。

【钛媒体作者引见:文/最极客 西方亦我国这片创新热土正在发生一场全面而深刻的产业结构变革。落,本文版权归“最极客”一切 】

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或许下载钛媒体App

AI翻译难以达到专业翻译水准,原因何在?