农企新闻网

“会说话的人,一启齿就赢了”——语音交互中的机器话术研讨

发布者:何书
导读“假如机器在某些理想的条件下 , 可以十分好地模拟人答复成绩 , 让发问者在相当长工夫里误认它不是机器, 那么机器就可以被以为是可以思想的 。”—— 阿兰·图灵“ 一团体的成功 , 约有 15% 取决于技术知识 ,85% 取决于口才艺术 。”—— 戴尔·卡耐基“ 与机器像和人一样对话” 大约是人类对人工智能最后的想象 , 也是人类希望在人工智能范畴完成的目的 。在不少科幻电影或小说里, 人工智能可

“会说话的人,一开口就赢了”——语音交互中的机器话术研究

“假如机器在某些理想的条件下 , 可以十分好地模拟人答复成绩 , 让发问者在相当长工夫里误认它不是机器, 那么机器就可以被以为是可以思想的 。”

—— 阿兰·图灵

“ 一团体的成功 , 约有 15% 取决于技术知识 ,85% 取决于口才艺术 。”

—— 戴尔·卡耐基

“ 与机器像和人一样对话” 大约是人类对人工智能最后的想象 , 也是人类希望在人工智能范畴完成的目的 。

在不少科幻电影或小说里, 人工智能可以和人自然交流 , 甚至可以谈情说爱 ( 如电影 《her》中的萨曼莎 )。 但我们不得不供认 , 理想和理想差距很大 。 如今的人工智能虽然曾经 “可以说话 ”, 但大少数都 “ 不会说话 ”, 我们常常可以听到 “ 这个成绩我还了解不了 , 假如你想……,可以这样对我说……”。

为了教会机器“ 像人一样说话 ”, 人们在语音辨认 、 自然言语了解 、 语音分解等诸多方面停止了少量探究 , 但这些探究次要集中在技术维度 , 而对机器话术涉猎较少 。

在汉语中 ,“ 术” 有技艺 、 办法之意 , 话术即指说话的技艺和办法 。 和技术相比 , 话术更偏艺术和兽性 。 乔布斯说 “ 只要技术是不够的——技术与人文艺 术结合 、 与兽性结合 , 才干带来让我们内心喜欢的后果 ”。 因而 , 我们本次从用户视角动身 , 尝试 从艺术和兽性的角度对话术停止探究 。

研讨次要包括以下内容 :

话术设计研讨: 我们如何做的

话术设计准绳:用户关注什么 ? 哪个更重要

话术设计建议:准绳如何指点话术设计

一 、 话术设计研讨: 我们如何做的 ?

当下的话术研讨多从研讨者视角动身,准绳次要源自研讨者的日常察看 、 哲学思辩和专业判别。 本次 , 我们从用户视角动身来讨论话术 ,研讨进程如下 :

“会说话的人,一开口就赢了”——语音交互中的机器话术研究

1. 案头研讨

我们对人与人的对话构造和对话准绳停止了零碎梳理, 特别引荐 Grice 的 “ 协作准绳”( 出自 《逻辑与会话 》 演讲 ,1967) 和索振羽的 “ 得体准绳”( 出自 《 语用学教程 》 第二版,2014)。 这一步至关重要 , 它加深了我们对 “对话” 的了解 , 这些准绳也成为我们设计实验话术时的重要参考根据 。

2. 对话场景设计

为掩盖尽能够多的场景, 我们零碎梳理了语音交互的典型场景 , 如听音乐 、 问天气 、 家居控制 、 生活效劳等 。 同时 , 每个场景下也细分了机器的不同形态 , 如能否听清 、 能否辨认 、能否有才能满足等 。

3. 详细话术设计

对话场景梳理明晰后, 我们针对每个场景设计实验所需话术 。 话术来源次要有二 , 一是主流语音交互产品的现有话术 , 二是研讨者基于人与人的对话准绳撰写而成的话术 。

4. 话术实验

上述预备完成后, 进入正式实验阶段 。 在实验中 , 我们创设了各类场景 ( 详细场景见 “对话场景设计” 局部 ), 并且模仿了真实的人机对话进程 ( 一切实验话术均转为语音分解音停止播报 ), 要求用户基于真实体验对不同场景下每类话术的爱好度停止评价 。

同时, 我们运用了 “ 参与式设计”, 以“ 假设你是机器, 你会如何答复 ” 为终点 , 引导用户更深地参与到话术设计中 , 共同讨论实验话术以及更为理想的表 达方式 。 这一进程使我们取得了少量源自用户的鲜活话术 , 也使我们能从更丰厚的角度发掘用户构建话术的准绳、 办法与技巧 。

5. 设计准绳提炼与验证

基于案头研讨和实验发现 , 我们提炼了初步的设计准绳。 之后 , 要求用户对准绳的可了解性、 片面性 、 适用性等停止评价 。 经过多轮评价 , 我们不时调整准绳, 最终取得了如今的话术设计准绳。

二、 话术设计准绳:用户关注什么 ? 哪个更重要 ?

我们发现, 在用户心中 , 好的话术要统筹感性和理性准绳。 感性准绳表现在 “机器的话是有用的 ”, 话术应该是以目的为中心 、 精确 、 简约的 ; 理性准绳强调 “对话进程令人愉悦 ”, 话术应该是自然 、 敌对 、 有特性的 。

“会说话的人,一开口就赢了”——语音交互中的机器话术研究

同时, 我们要求用户基于本身体验对各准绳的重要性停止了 1 -10 级评价 , 其中 1 分代表十分不重要 ,10 分代表十分重要, 分数越高 , 重要性越高 。

后果发现, 现阶段 ,用户更看重感性准绳, 尤其是以目的为中心 , 精确 , 而自 然 、 敌对等理性准绳暂居绝对主要的地位 。

“会说话的人,一开口就赢了”——语音交互中的机器话术研究

此外 , 我们也梳理了不同准绳下的详细评价目标 , 这些目标代表在该准绳下 ,用户在对话中详细的关注点 。 不同目标的重要性有所不同 , 详见下表 。

“会说话的人,一开口就赢了”——语音交互中的机器话术研究

三、 话术设计建议:准绳如何指点话术设计?

接上去, 我们一同看看上述这些准绳如何指点详细的机器话术设计。

1. 以目的为中心准绳

以目的为中心是用户最为看重的准绳。用户十分注重效率 ( 闲谈场景除外 ), 他们希望机器的回复与本人的需求高相关 ,可以疾速达故意中所想 。

同时,用户表示在语音交互中 , 需求更多 “ 引导 ”, 尤其需求理解机器当下和将来形态 。 语音看不见摸不着 , 我们无法像在图形用户界面 (GUI) 中那样——经过导航条判别所在的地位 ,看到按钮可以判别能否点击等 。 假如短少必要的引导 ,用户在语音交互中很容易迷茫 , 发生各类负面心情 。

因而, 话术设计时 , 必需遵照以目的为中心准绳, 做好引导 , 让用户可以经过声响 “ 看到 ”通往需求的途径 。 基于此准绳,设计话术时可思索以下几条建议:

建议 1: 优先回使用户的中心意图

围绕用户最关怀的成绩优先给出合适的回应 。

“会说话的人,一开口就赢了”——语音交互中的机器话术研究

建议 2: 清楚传达机器以后的状况

假如由于各种缘由无法直接满足用户需求时 , 应及时告知 , 防止用户困惑 。

“会说话的人,一开口就赢了”——语音交互中的机器话术研究

建议 3: 廓清目的 , 不随便终结对话

对话进程中 , 引导用户不时廓清目的 , 不随便做话题的终结者 。

“会说话的人,一开口就赢了”——语音交互中的机器话术研究

建议 4: 通知用户接上去怎样做

不能明晰辨认用户意图时 , 可自动讯问用户有能够的意图 , 引导用户完成目的 。

“会说话的人,一开口就赢了”——语音交互中的机器话术研究

建议 5: 提供相关替代方案

在无法直接满足用户时 , 可思索提供相关度较高的替代方案 , 直接满足用户。

“会说话的人,一开口就赢了”——语音交互中的机器话术研究

2. 精确准绳

用户以为表达精确是最根本的准绳。 表述不精确能够招致用户曲解 、 无法判别机器所要传达的真正含义 , 使对话脱离正轨甚至无法停止 。

基于精确准绳,设计话术时可思索以下建议:

建议 1: 防止表述有歧义

表述的含义要确定, 不要说让用户“ 这样了解可以, 那样了解也可以” 的话 。 口语中最罕见的歧义是同音歧义 , 即语音相反带来的歧义 。 以下两类同音歧义 , 话术设计时需求留意 :

同音异形词歧义, 如播放菜谱时提到 “ 切 ji 放糖 ”, 是“ 记 ” 还是 “ 忌 ”?

同音同形词歧义 , 如闲谈时提到 “ 我最喜欢杜鹃啦 ”, 是杜鹃这种花还是杜鹃这种鸟 ?

建议 2: 防止表述过于笼统模糊

表述要尽能够详细明白 , 防止过于笼统模糊 。

我们来看上面一个案例,研讨中 , 面对第一种话术 , 大少数用户表示 “ 有点懵 ”,“ 是给音箱起名字, 还是通知音箱本人的名字 ? 不晓得该怎样答复 ”。 而第二种话术则明白指出是 “ 音箱对本人的称谓 ”。

“会说话的人,一开口就赢了”——语音交互中的机器话术研究

3. 简约准绳

在研讨中 ,用户屡次提到 “ 不喜欢这个话术 , 太啰嗦了 , 能不能 拣 重点说 ”,“ 说太多了 ,压根没记住啊 ”, 这些埋怨表现了用户对简约的注重 。

用户如此注重简约是必定的。 语音是一维线性的 , 只能一个字一个字的听完 , 无法快进 , 不能前进 。 哪怕信息不相关 、 有意义 ,用户都无法略过 。 这些冗余信息既糜费用户工夫 , 也会添加用户的焦躁心情 。

更重要的是, 大脑能处置的语音信息量无限 , 一旦超出会给人的任务记忆形成担负 。 临时以来 , 神奇数字 7±2 被以为是任务记忆的容量 , 但近期这一规范遭到质疑 , 普遍以为这一估量偏高 。 有研讨者 (Mastin,2010) 以为这一数字能够是 4±1。

基于此准绳,设计话术时可思索以下几条建议:

建议 1: 表述复杂明了 , 不啰嗦

传递必要信息前提下 , 坚持话术简约 。

“会说话的人,一开口就赢了”——语音交互中的机器话术研究

建议 2: 防止信息量过大 , 一次提供的选项不超越三个

单次交互提供的信息量不要过大 , 以免给用户形成认知和记忆担负 。

“会说话的人,一开口就赢了”——语音交互中的机器话术研究

4. 自然准绳

在研讨中, 听到某些话术 ,用户纷繁表示 “ 这太僵硬了 , 一点都不自然 ”,“ 这分明就是机器说的话 , 人怎样能够这么说呢 ”。用户希望话术可以贴近生活 , 尽能够自然 。

这是十分好了解的。 在人机语音交互中 , 人类最想运用的一定是自然言语 。 行动言语是人类最擅长 , 运用门槛最低的自然言语 , 人类运用行动言语停止交流的历史已跨越十万年 。 与之相比 , 口语言的开展不过五千年 , 计算机言语更是刚刚萌芽 。 因而 ,设计话术时 , 可参考汉语行动言语的特点 , 营建 “ 自然感 ”。

基于此准绳,设计话术时可思索以下几条建议:

建议 1: 措辞口语化

日常对话中 , 我们会运用丰厚多彩的堆叠词 ( 如看看 、 马下马上 )、 语气词 ( 如吧 、 呢、哈 )、 感慨词 ( 如哎 ! 天 !)、 活灵活现的象声词 ( 如噗通 、 呼啦 )、 填补词 ( 如嗯, 呃 ), 也会妙用各种副言语 , 如 “ 哼哼 ” 之类的鼻化音 、 笑声 、 颤音等等 。 话术设计中,可以参考这些口语化的表达 。

尤其留意 , 话术设计时要尽能够防止专业术语 、 技术名词 、 流畅用语等 。

“会说话的人,一开口就赢了”——语音交互中的机器话术研究

建议 2: 句式自然 , 可运用话语标志

口语中句子多短小 , 构造复杂 。 言语学研讨发现 , 口语中长句占比仅 19%, 短句占比到达 81%(超越 7 个虚词的单句为长句 , 反之为短句 。 虚词指具有实践含义且能独自充任句子成分的词 )。 话术设计时可思索这一特点 , 尽能够运用短句 。

另外 , 口语对话中会运用 “ 话语标志语 ” 做句子之间的过渡 , 话术设计时也可参考 。 罕见的话语标志有 :“ 首先…然后…最初 ” 之类的序列标志 ;“ 开端 ”、“ 当前 ” 之类的工夫标志 ;“这”、“ 那 ” 之类的指示词等 。

建议 3: 添加措辞多样性

运用同义词为固定的答案添加多样性 , 比方表示确认的时分 ,可以随机出现 “ok”、“ 收到 ”、“好的 ”、“ 没成绩 ” 等等 。 这些同义词可以添加对话生机 , 让对话更自然 。

5. 敌对准绳

研讨中, 我们发现 ,用户很恶感机器以 “ 高人一等 ” 的姿势说话 , 尤其恶感被机器责备 。 高人一等的话语和责备会让用户觉得 “ 不忿 ”、“ 挫败 ”, 甚至会丧失对机器的 “ 信任 ”。

人是社会性植物。 日常交往中 , 我们更喜欢对我们敌对 、 喜欢我们的人 , 而倾向远离那些不够友善的人 。 判别对方能否友善 , 语音是最直观的线索 。 在人机语音交互中 , 我们异样能依据机器的应对判别其能否敌对 。 因而 , 话术设计时要注重敌对 。

基于此准绳, 话术设计时可思索以下几条建议:

建议 1: 错误归为机器, 而非人

错误发作时 , 从机器的角度阐明出错缘由 。

“会说话的人,一开口就赢了”——语音交互中的机器话术研究

建议 2: 防止要求用户依照特定的方式表达

尊重用户的说话方式 , 不要试图教给用户怎样说话 。

“会说话的人,一开口就赢了”——语音交互中的机器话术研究

建议 3: 表现 “ 关注用户需求 ” 的效劳态度

即便不能满足用户需求 , 也要表现出努力协助用户的态度 。

“会说话的人,一开口就赢了”——语音交互中的机器话术研究

6. 有特性准绳

必需强调, 话术表现的特性必需与产品人设坚持分歧 , 比方冷静成熟的产品人设就不太合适嗲嗲说话撒娇卖萌的话术 。

本次我们发现,用户对 “ 幽默 ” 的话术承受度较高 。 在人际交往中 , 幽默能提升别人对本人的印象 , 让人觉得密切并能协助人们缓解压力 。 语用学研讨也发现 , 只需合适特定场景 , 幽默话语的交际效果是最佳的 。

不过, 幽默具有分明的文明和群体差别 ,“ 甲之蜜糖 , 乙之砒霜 ”,设计话术时需特别留意 。

建议 1: 遇到难题时 , 可思索运用幽默话术回应

遇到无法完成的功用时 , 经过幽默话术回使用户, 调理气氛 。

“会说话的人,一开口就赢了”——语音交互中的机器话术研究

建议 2: 文娱话题的表述可以愈加生动风趣

讨论一些文娱话题或闲谈时 , 话术可以思索增添更多兴趣元素 。

“会说话的人,一开口就赢了”——语音交互中的机器话术研究

四、 小结

本文从用户视角动身 , 论述了机器话术设计的 6 大普适性准绳, 以及如何基于这些准绳设计话术 。 我们定义的设计准绳及提供的设计建议如下 :

“会说话的人,一开口就赢了”——语音交互中的机器话术研究

话术研讨具有应战性。 话术与对话场景 、 对象 , 产品自身的人设 、 特性 , 零碎语音辨认 、语义了解才能等均具有亲密关系 。 但这无妨碍我们经过参与式的用户研讨探究话术设计的普适性准绳。 所谓 “ 深根固柢 ”, 这些准绳是机器话术设计时的根底与根基 , 有助于我们打造更自然和极致的语音对话体验 。

我们也以此研讨为契机, 开端探究在 AI 时代 , 在机器话术这个范畴 , 如何将技术和艺术 、兽性结合 , 希望能带来让用户内心真正喜欢的体验 。

机器话术作为一个充溢艺术特征又与兽性密不可分的主题, 还有着许多未知且充溢魅力的方面值得探究 。 希望本次研讨可以抛砖引玉 , 引发更多同仁更深化的研讨。

本文被转载1次

首发媒体 砍柴网 | 转发媒体