雷锋网 (大众号:雷锋网) 按:如今风行海外外的各款智能音箱,均有一个唤醒词,包括“小度小度”“若琪”“叮咚叮咚”等。他们为什么叫这些名字?本文是来自百度AI 交互设计院(微信:gh_8d606ce3c1a5)的投稿,他们经过实验的方式、从数据角度,剖析这些唤醒词的特征,通知你,智能语音交互产品该“叫”什么名字。雷锋网对文章作了不改动原意的编辑。
一、什么是“唤醒词”以及它为什么重要?
1. “唤醒”和“唤醒词”
在讨论名字之前,首先对语音交互进程中的一些定义做一个复杂的引见。
据雷锋网理解,语音交互的进程与平常人与人之间交流的方式十分类似,有问有答。比方某个阴天,你对同事呼喊称:“小明”,小明听到了低头看你表示在听,你接着问“明天会下雨么?”小明翻开手机查了一下明天的天气预告,然后答复你说“天气预告说下午3-4点有雷阵雨”。
智能音箱亦如此,其 语音交互流程被划分为五个环节 – 唤醒、呼应、输出、了解、反应。 其中唤醒是每一次用户与语音产品交互的第一个接触点,唤醒环节的体验在整个语音交互流程中至关重要,它的体验好坏将直接影响用户对产品的“第一印象”。
同时,虽然是“智能”语音交互产品,机器仍没有人类聪明。据雷锋网理解,关于目前市面上罕见的语音交互产品来说,一个眼神或许一个举措还不能惹起它的留意,因而 需求定义一个将产品从待机形态切换到任务形态的词语,即所谓的“唤醒词”。
异样是上文所提到的“问天气”案例。经过呼喊“小明”的名字,来惹起他的留意,而关于智能语音交互产品,也需求经过叫出“名字”,也就是唤醒词来激活设备。以智能音箱产品为例,“小度小度”是唤醒渡鸦raven H的唤醒词,“Hey Google”是唤醒Google Home的唤醒词,“Alexa”是唤醒Echo的唤醒词。
2. “唤醒词”对用户体验的影响
据雷锋网理解, 影响语音唤醒体验的要素包括两个维度——输出和输入。 输出环节的影响要素包括唤醒词、唤醒方式,输入环节的影响要素包括唤醒呼应速度、唤醒反应方式、唤醒成功率和误唤醒率。
而关于用户来说,唤醒词是语音唤醒输出环节中较为重要的影响要素,且一个好的唤醒词,会直接影响唤醒率。
二、怎样设计一个好的“唤醒词”?
针对唤醒词,次要经过以下两个实验停止了研讨:
-
实验一:现有唤醒词组合方式研讨
-
实验二:唤醒词语音要素研讨
实验一:现有唤醒词组合方式研讨
首先,对市场上各类语音交互设备唤醒词的组合方式停止拆解,发现唤醒词均是在一个复杂“名字”的根底上加以变化而构成,此外,“名字”自身也具有不同的构成方式。在实验中,为用户提供不同组合方式的唤醒词,由用户依据其团体爱好水平在5点量表上停止评价(1-十分不喜欢、2-不喜欢、3-普通、4-喜欢、5-十分喜欢)。
实验后果标明,不同组合方式下,用户的爱好水平不同:
1)在以“名字”为根底的不同组合方式中,“名字+名字”的叠词式组合方式最受用户喜欢,而“品牌+名字”的组合方式最不被用户喜欢。
2)另外,就“名字”自身而言,“小+字”的名字最受用户喜欢。这点也与汉语人名命名习气相符,《汉语人名用字的统计剖析(郑淑花,2010)》显示,“小”字在人名命名十大常用字之中。
实验二:唤醒词语音要素研讨
据雷锋网理解,音节是听觉上最容易分辨出来的语音单位,也是最自然的语音单位,汉字中一个汉字读音就是一个音节,每个根本音节都是由腔调、声母和韵母三个局部构成。
理想条件下,对唤醒词每一音节的腔调、声母、韵母停止研讨,但是由于音节数的添加,研讨变量数将大幅度增长,招致无法经过一次实验来完成。
另外,经过文献查阅,发现人们在起汉语人名时,会将尾音节的发音状况列入考量,同时,汉语人名/宠物名统计研讨中也多见其对尾音节发音状况的统计。
因而,综合文献和前文实验的结论,本次实验中以唤醒词尾音节为研讨对象,选取“小+字”的构词构造,变换尾音节,停止唤醒词的发音偏好实验。同时为防止用户受汉字自身字义的影响,实验中用户看到的唤醒词均为标有腔调的拼音。在实验中,要求用户依据其团体爱好水平在5点量表上对唤醒词停止评价(1-十分不喜欢、2-不喜欢、3-普通、4-喜欢、5-十分喜欢)。
实验后果标明:
1)腔调方面,用户最喜欢阴平(1声);另外相较“仄声”(3声上声、4声去声统称为“仄”),用户愈加喜欢“平声”(1声阴平、2声阳平统称为“平”)。
2)声母方面,用户愈加喜欢尾音声母为零声母,而包括了z、c、s的舌尖前音最不被用户所喜欢。
3)韵母方面,从韵母发音时的启齿口型来看,用户更喜欢启齿口型较大的齐齿呼和启齿呼;另外从韵母构造来看,音节韵母为单韵母的词最受用户的喜欢。
三、小结
本文次要围绕智能语音交互设备的唤醒词展开研讨,从唤醒词组合方式和语音要素两个方面讨论了影响用户体验的要素,发现:
1)现有唤醒词组成方式方面:
-
在以“名字”为根底的不同组合方式中,“名字+名字”的叠词式组合方式最受用户喜欢,而“品牌+名字”的组合方式最不被用户喜欢;
-
就“名字”自身而言,“小+字”的名字最受用户喜欢。
2)语音要素方面:
-
腔调:用户最喜欢阴平,同时相较“仄声”,用户愈加喜欢“平声”;
-
声母:用户愈加喜欢尾音声母为零声母,而包括了z、c、s的舌尖前音最不被用户所喜欢;
-
韵母: 依照韵母发音时的口型启齿状况来看,用户更喜欢启齿口型较大的齐口呼和启齿呼;另外依照韵母构造来看,音节韵母为单韵母的词最受用户的喜欢。
基于本文的研讨,雷锋网读者们能否曾经掌握如何结构一个好的唤醒词的办法了?以下是结合搜集的用户自定义唤醒词及本文研讨结论,为唤醒词作出的分类,供读者们使用参考。
需求留意的是,本文是从用户视角动身,对唤醒词停止了迷信的研讨和讨论,但是实践在设计唤醒词时,需求思索的要素还有很多,如:唤醒词能否过于罕见招致语音设备容易被误唤醒,唤醒词与品牌之间能否具有关联。另外,受以后语音技术的限制,现有的唤醒词多以4音节词居多,但将来随着语音技术的提高,唤醒词的长度存在变短的趋向,在设计唤醒词时还应思索其可优化的空间等等。
特别注明:由于实验设定的条件和样本数量等限制要素,本次实验研讨结论或许不能代表一切智能产品用户在家居环境的全部感受。
雷锋网版权文章,未经受权制止转载。概况见。