在最近谷歌的Google I/O大会上,谷歌CEO“劈柴“直接祭出了这次大会的王牌AI,这个AI产品似乎像人们展示了人工智能技术的进一步提升,Assistant的“继续性对话”功用让对话更自然,而“多重举动”功用让用户在一次对话中可以提出多个成绩。
这似乎是一个标志性的转变,存在对话僵硬、无法多轮对话等诸种弊端的语音助手在这场GoogleI/O大会上表现的尤为智能。相比Apple Siri和Microsoft Cortana只能机械式对话的语音互动,Google Assistant似乎表现尤为优良(至多在发布会上),那么,GoogleAssistant的呈现是谷歌在AI语音助手范畴的一张王牌吗?
冷艳全场的“嗯哼”
想要探求AI语音助手的智能水平,其评判规范就是如何做到让AI“像人”,这是一个深度学习的才能成绩,而表现在表现方式上则为“话术”,如何可以让语音助手真正打破“图灵测试”,让用户人机难辨。但是,当下Google Assistant似乎正朝着片面“类人化”的方向开展。
以Google Assistant在GoogleI/O大会上的表现为例,发布会上,用户对Google Assistant说:我想剪头发。Google Assistant承受指令后直接帮你电话预定。
Google Assistant先拨通了Jim理发店的电话,停止电话预定剪发。
Google Assistant:你觉得工夫定为3号可以吗?
理发店:我需求查查Jim教师的档期,稍等。
Google Assistant:嗯哼?
这一句“嗯哼”让全场所冷艳,AI的反响似乎出乎了一切人的意料,但是,这一切并没有完毕。
理发店:3号12点不行,Jim教师曾经有预定了。
Google Assistant:那10点到12点这段工夫呢?
理发店:您的顾客是想烫头发还是剪头?
Google Assistant:只是复杂修剪一下。
理发店:那没有成绩,我们10点见!
固然,关于人类来说,此类“嗯”、“呃”之类的语气词是再正常不过,可是关于机器而言,这是一件难以做到的事情。现实上,Google Assistant说“嗯嗯”,好似在摇头赞同;而其所拉长的某些词的发音,又仿佛它正在花工夫去考虑一个成绩的答案,当然,这一切都是是由编程算法即时完成的。
谷歌助手的面前是一种称之为“Duplex”的技术,这由纽约、特拉维夫和山景城的谷歌工程师和产品设计师结合开发,该技术可完成一小局部人可以完成预订餐厅、检查假日工夫等通常经过电话停止的活动。一切这些交互都发作在后端——谷歌数字助理Assistant和餐厅之间。
搭载数字助理Assistant的智能家居
此外,Google Assistant除了一种男性发音和女性发音外,其还可以用六种声响说话。谷歌还运用户可以更轻松地提出后续成绩,并在开车并运用谷歌地图时自意向某些人发送你的估计抵达工夫。
GoogleAssistant真的“完满无缺”吗?
Google Assistant新技术的使用,许多人以为“这下真的分不清对面对面是人是狗了”,但是,Google Assistant显然并不是完满无瑕,皮查伊在开发者大会上展现的 demo 间隔呼吁行业者在政府部门出台相关政策标准的之前,从业者一定要规范自己的行为准则健康有序的快速发展。落地还有多远?所展现的GoogleAssistant落地后真的会如此冷艳吗?智能绝对论(aixdlun)剖析师柯鸣以为,谷歌语音助理虽然曾经打破了众多技术瓶颈,但其真正可以使用于生活场景中,并完全替代“人类助理”,仍然尚需时日。
首先,google duplex似乎曾经可以处理自然对话的成绩。展开一段自然的对话有这么几个难点:自然言语难以了解,人类的自然行为很难建模,人类对延迟的耐受性很低所以需求高处置速度,以及生成听起来自然的语音,其中还要适外地夹杂一些语气词。
谷歌结合运用了一个级联 TTS 引擎和一个生成式 TTS 引擎(其中运用了 Tacotron 和 WaveNet),依据不同的情境控制语音的语调。
为了让语音变得愈加亲切自然,这个零碎可以生成一系列语气词,这也是让大家所惊叹的中央,比方“hmmm”、“uh”等语气词。
当级联 TTS 需求组合变化很大的语音单元,或许需求添加生成的进展时,语气词就会被添加到生成的语音中,这就让这个零碎可以以一种自然的方式向对方表示“是的我听着呢”或许“我还在思索”(人类说话的时分就常常在考虑的同时收回一些语气词)。谷歌的用户调查也确认了人类觉得带有语气词的对话更熟习、更自然。
Duplex的运作形式
但是,也正是TTS的表现让人觉得其仍有可商榷之处。如从自然言语训练的办法角度看,经过充沛的数据梳理,借助机器学习在某个单一范畴穷举各种状况,继而到达Google 在明天所展现的效果尚有能够。
但目前没有公司可以做到全方位了解各种场景。也就是说,Google Assistant所擅长的也是针对特定场景的,例如预订餐位和理发。
这能否在一切场景中具有普适性,目前仍然无法得知。从这个角度来看,小场景无限话题模仿对话并不是难题,针对 demo 优化到流利也可以做到,这能否可以真正替代“人类助理”,仍然是一个尚未确知的成绩。
其次,从伦理和信息平安的的角度来看,Google Assistant仍然存在着诸多争议。比方,谷歌官方曾表示:“如今的技术并没有到达只经过与开发人员对话就学会如何像人一样说话的程度,为了取得高精度,我们在匿名电话的会话数据库上对Duplex的RNN停止了训练。”
在数百个小时的训练进程中,它记载下了客户们电话中的通话记载。这让我们又一次回到了十年来不断在停止的争辩,即维护团体数据隐私和推进技术便当的界线终究在何处,Facebook的信息泄露案更将这个成绩推到了风口浪尖。
当然,假使撇开公地喜剧的存在主义处理方案不谈,Duplex AI的呈现还暴露了许多实践成绩。例如,如何避免某人合法应用大众人物的录音来训练人工智能,并生成伪造的音频?
此外,我们还需求避免伪造视频的攻击,鉴于人们曾经可以伪造图像和视频(甚至色情),并可以兼并一层虚伪音频,谷歌和Facebook的内容审核任务将面临着更大的困难。
谷歌这条路好走吗?
谷歌语音助手这条路,曾经走了很久。最早的GoogleNow作为谷歌语音助手的最后方式呈现在人们面前,Google Now 2012 年最早呈现在安卓 4.1 和 Nexus 手机上,随后又推出面向挪动设备信息疾速检索效劳的“Now On Tap”、以及“Now cards”。
从 2016 年开端,Google Assistant 就开端逐渐取代 Google Now,相应的功用也被交换,“Now cards”被“Feed”取代,“Now on Tap”被“Screen Search”所取代。
最早于2016年与Google Home一同亮相的Google Assistant,依托着谷歌系产品的用户量级,虽然同类竞品亚马逊的Echo曾经占据一定市场,但是仍然有着一定开展的前景和底气。
但是,假如谷歌的目的是让Assistant成为拟人化的谷歌,那么仍有很多事情要做。若想完成与斯派克·琼斯(Spike Jonze)科幻电影《她》(Her)中的操作零碎Samantha停止对话的那样,谷歌仍然还有一定间隔。、
当然,相较于市场上同类系的其他产品,Google Assistant的表现的确稍显优秀。Stone Temple Consulting与ROAST公司2018年发布的智能语音助理测试报告也显示,Google Assistant手机版能答复的标题最多,高达90%,精确率也有将近80%的超高表现。
来源:Stone Temple Consulting、ROAST测试报告
其实,严厉来说,谷歌的竞争对手Alexa,Siri和Cortana都没有兑现他们的承诺。Alexa,Siri等都存在着或大或小的成绩,每个产品在市场中的表现似乎都没有人们想象中的优良。
当然,谷歌并非第一个进入语音助理范畴的公司。作为后来者,CIRP公司的数据显示,2016年发布的GoogleHome占有31%的市场份额,较之亚马逊的69%的市场份额稍显缺乏。
总的来说, “AI很好,但不够惊人”,一直是近年来覆盖在AI语音市场上的浓厚暗影。当然,随着日后GoogleAssistant新技术的逐步使用,这能否可以成为谷歌新的“杀手锏”仍需工夫检验,而谷歌语音助理的这条路,也将坚决的走下去。
声明:本文内容和图片仅代表作者观念,不代表蓝鲸TMT网立场,转载需注明本文出处及原创作者姓名!