“会说话的人，一启齿就赢了”——语音交互中的机器话术研讨

2025-08-04 21:10:49

导读“假如机器在某些理想的条件下，可以十分好地模拟人答复成绩，让发问者在相当长工夫里误认它不是机器，那么机器就可以被以为是可以思想的。”—— 阿兰·图灵“ 一团体的成功，约有 15% 取决于技术知识，85% 取决于口才艺术。”—— 戴尔·卡耐基“ 与机器像和人一样对话” 大约是人类对人工智能最后的想象，也是人类希望在人工智能范畴完成的目的。在不少科幻电影或小说里，人工智能可

“会说话的人，一开口就赢了”——语音交互中的机器话术研究

“假如机器在某些理想的条件下，可以十分好地模拟人答复成绩，让发问者在相当长工夫里误认它不是机器，那么机器就可以被以为是可以思想的。”

—— 阿兰·图灵

“ 一团体的成功，约有 15% 取决于技术知识，85% 取决于口才艺术。”

—— 戴尔·卡耐基

“ 与机器像和人一样对话” 大约是人类对人工智能最后的想象，也是人类希望在人工智能范畴完成的目的。

在不少科幻电影或小说里，人工智能可以和人自然交流，甚至可以谈情说爱（如电影《her》中的萨曼莎）。但我们不得不供认，理想和理想差距很大。如今的人工智能虽然曾经 “可以说话 ”，但大少数都 “ 不会说话 ”，我们常常可以听到 “ 这个成绩我还了解不了，假如你想……，可以这样对我说……”。

为了教会机器“ 像人一样说话 ”，人们在语音辨认、自然言语了解、语音分解等诸多方面停止了少量探究，但这些探究次要集中在技术维度，而对机器话术涉猎较少。

在汉语中，“ 术” 有技艺、办法之意，话术即指说话的技艺和办法。和技术相比，话术更偏艺术和兽性。乔布斯说 “ 只要技术是不够的——技术与人文艺术结合、与兽性结合，才干带来让我们内心喜欢的后果 ”。因而，我们本次从用户视角动身，尝试从艺术和兽性的角度对话术停止探究。

研讨次要包括以下内容：

话术设计研讨：我们如何做的

话术设计准绳：用户关注什么？哪个更重要

话术设计建议：准绳如何指点话术设计

一、话术设计研讨：我们如何做的？

当下的话术研讨多从研讨者视角动身，准绳次要源自研讨者的日常察看、哲学思辩和专业判别。本次，我们从用户视角动身来讨论话术，研讨进程如下：

“会说话的人，一开口就赢了”——语音交互中的机器话术研究

1. 案头研讨

我们对人与人的对话构造和对话准绳停止了零碎梳理，特别引荐 Grice 的 “ 协作准绳”（出自《逻辑与会话》演讲，1967）和索振羽的 “ 得体准绳”（出自《语用学教程》第二版，2014）。这一步至关重要，它加深了我们对 “对话” 的了解，这些准绳也成为我们设计实验话术时的重要参考根据。

2. 对话场景设计

为掩盖尽能够多的场景，我们零碎梳理了语音交互的典型场景，如听音乐、问天气、家居控制、生活效劳等。同时，每个场景下也细分了机器的不同形态，如能否听清、能否辨认、能否有才能满足等。

3. 详细话术设计

对话场景梳理明晰后，我们针对每个场景设计实验所需话术。话术来源次要有二，一是主流语音交互产品的现有话术，二是研讨者基于人与人的对话准绳撰写而成的话术。

4. 话术实验

上述预备完成后，进入正式实验阶段。在实验中，我们创设了各类场景（详细场景见 “对话场景设计” 局部），并且模仿了真实的人机对话进程（一切实验话术均转为语音分解音停止播报），要求用户基于真实体验对不同场景下每类话术的爱好度停止评价。

同时，我们运用了 “ 参与式设计”，以“ 假设你是机器，你会如何答复 ” 为终点，引导用户更深地参与到话术设计中，共同讨论实验话术以及更为理想的表达方式。这一进程使我们取得了少量源自用户的鲜活话术，也使我们能从更丰厚的角度发掘用户构建话术的准绳、办法与技巧。

5. 设计准绳提炼与验证

基于案头研讨和实验发现，我们提炼了初步的设计准绳。之后，要求用户对准绳的可了解性、片面性、适用性等停止评价。经过多轮评价，我们不时调整准绳，最终取得了如今的话术设计准绳。

二、话术设计准绳：用户关注什么？哪个更重要？

我们发现，在用户心中，好的话术要统筹感性和理性准绳。感性准绳表现在 “机器的话是有用的 ”，话术应该是以目的为中心、精确、简约的；理性准绳强调 “对话进程令人愉悦 ”，话术应该是自然、敌对、有特性的。

“会说话的人，一开口就赢了”——语音交互中的机器话术研究

同时，我们要求用户基于本身体验对各准绳的重要性停止了 1 -10 级评价，其中 1 分代表十分不重要，10 分代表十分重要，分数越高，重要性越高。

后果发现，现阶段，用户更看重感性准绳，尤其是以目的为中心，精确，而自然、敌对等理性准绳暂居绝对主要的地位。

“会说话的人，一开口就赢了”——语音交互中的机器话术研究

此外，我们也梳理了不同准绳下的详细评价目标，这些目标代表在该准绳下，用户在对话中详细的关注点。不同目标的重要性有所不同，详见下表。

“会说话的人，一开口就赢了”——语音交互中的机器话术研究

三、话术设计建议：准绳如何指点话术设计？

接上去，我们一同看看上述这些准绳如何指点详细的机器话术设计。

1. 以目的为中心准绳

以目的为中心是用户最为看重的准绳。用户十分注重效率（闲谈场景除外），他们希望机器的回复与本人的需求高相关，可以疾速达故意中所想。

同时，用户表示在语音交互中，需求更多 “ 引导 ”，尤其需求理解机器当下和将来形态。语音看不见摸不着，我们无法像在图形用户界面（GUI）中那样——经过导航条判别所在的地位，看到按钮可以判别能否点击等。假如短少必要的引导，用户在语音交互中很容易迷茫，发生各类负面心情。

因而，话术设计时，必需遵照以目的为中心准绳，做好引导，让用户可以经过声响 “ 看到 ”通往需求的途径。基于此准绳，设计话术时可思索以下几条建议：

建议 1：优先回使用户的中心意图

围绕用户最关怀的成绩优先给出合适的回应。

“会说话的人，一开口就赢了”——语音交互中的机器话术研究

建议 2：清楚传达机器以后的状况

假如由于各种缘由无法直接满足用户需求时，应及时告知，防止用户困惑。

“会说话的人，一开口就赢了”——语音交互中的机器话术研究

建议 3：廓清目的，不随便终结对话

对话进程中，引导用户不时廓清目的，不随便做话题的终结者。

“会说话的人，一开口就赢了”——语音交互中的机器话术研究

建议 4：通知用户接上去怎样做

不能明晰辨认用户意图时，可自动讯问用户有能够的意图，引导用户完成目的。

“会说话的人，一开口就赢了”——语音交互中的机器话术研究

建议 5：提供相关替代方案

在无法直接满足用户时，可思索提供相关度较高的替代方案，直接满足用户。

“会说话的人，一开口就赢了”——语音交互中的机器话术研究

2. 精确准绳

用户以为表达精确是最根本的准绳。表述不精确能够招致用户曲解、无法判别机器所要传达的真正含义，使对话脱离正轨甚至无法停止。

基于精确准绳，设计话术时可思索以下建议：

建议 1：防止表述有歧义

表述的含义要确定，不要说让用户“ 这样了解可以，那样了解也可以” 的话。口语中最罕见的歧义是同音歧义，即语音相反带来的歧义。以下两类同音歧义，话术设计时需求留意：

同音异形词歧义，如播放菜谱时提到 “ 切 ji 放糖 ”，是“ 记 ” 还是 “ 忌 ”？

同音同形词歧义，如闲谈时提到 “ 我最喜欢杜鹃啦 ”，是杜鹃这种花还是杜鹃这种鸟？

建议 2：防止表述过于笼统模糊

表述要尽能够详细明白，防止过于笼统模糊。

我们来看上面一个案例，研讨中，面对第一种话术，大少数用户表示 “ 有点懵 ”，“ 是给音箱起名字，还是通知音箱本人的名字？不晓得该怎样答复 ”。而第二种话术则明白指出是 “ 音箱对本人的称谓 ”。

“会说话的人，一开口就赢了”——语音交互中的机器话术研究

3. 简约准绳

在研讨中，用户屡次提到 “ 不喜欢这个话术，太啰嗦了，能不能拣重点说 ”，“ 说太多了，压根没记住啊 ”，这些埋怨表现了用户对简约的注重。

用户如此注重简约是必定的。语音是一维线性的，只能一个字一个字的听完，无法快进，不能前进。哪怕信息不相关、有意义，用户都无法略过。这些冗余信息既糜费用户工夫，也会添加用户的焦躁心情。

更重要的是，大脑能处置的语音信息量无限，一旦超出会给人的任务记忆形成担负。临时以来，神奇数字 7±2 被以为是任务记忆的容量，但近期这一规范遭到质疑，普遍以为这一估量偏高。有研讨者（Mastin，2010）以为这一数字能够是 4±1。

基于此准绳，设计话术时可思索以下几条建议：

建议 1：表述复杂明了，不啰嗦

传递必要信息前提下，坚持话术简约。

“会说话的人，一开口就赢了”——语音交互中的机器话术研究

建议 2：防止信息量过大，一次提供的选项不超越三个

单次交互提供的信息量不要过大，以免给用户形成认知和记忆担负。

“会说话的人，一开口就赢了”——语音交互中的机器话术研究

4. 自然准绳

在研讨中，听到某些话术，用户纷繁表示 “ 这太僵硬了，一点都不自然 ”，“ 这分明就是机器说的话，人怎样能够这么说呢 ”。用户希望话术可以贴近生活，尽能够自然。

这是十分好了解的。在人机语音交互中，人类最想运用的一定是自然言语。行动言语是人类最擅长，运用门槛最低的自然言语，人类运用行动言语停止交流的历史已跨越十万年。与之相比，口语言的开展不过五千年，计算机言语更是刚刚萌芽。因而，设计话术时，可参考汉语行动言语的特点，营建 “ 自然感 ”。

基于此准绳，设计话术时可思索以下几条建议：

建议 1：措辞口语化

日常对话中，我们会运用丰厚多彩的堆叠词（如看看、马下马上）、语气词（如吧、呢、哈）、感慨词（如哎！天！）、活灵活现的象声词（如噗通、呼啦）、填补词（如嗯，呃），也会妙用各种副言语，如 “ 哼哼 ” 之类的鼻化音、笑声、颤音等等。话术设计中，可以参考这些口语化的表达。

尤其留意，话术设计时要尽能够防止专业术语、技术名词、流畅用语等。

“会说话的人，一开口就赢了”——语音交互中的机器话术研究

建议 2：句式自然，可运用话语标志

口语中句子多短小，构造复杂。言语学研讨发现，口语中长句占比仅 19%，短句占比到达 81%（超越 7 个虚词的单句为长句，反之为短句。虚词指具有实践含义且能独自充任句子成分的词）。话术设计时可思索这一特点，尽能够运用短句。

另外，口语对话中会运用 “ 话语标志语 ” 做句子之间的过渡，话术设计时也可参考。罕见的话语标志有：“ 首先…然后…最初 ” 之类的序列标志；“ 开端 ”、“ 当前 ” 之类的工夫标志；“这”、“ 那 ” 之类的指示词等。

建议 3：添加措辞多样性

运用同义词为固定的答案添加多样性，比方表示确认的时分，可以随机出现 “ok”、“ 收到 ”、“好的 ”、“ 没成绩 ” 等等。这些同义词可以添加对话生机，让对话更自然。

5. 敌对准绳

研讨中，我们发现，用户很恶感机器以 “ 高人一等 ” 的姿势说话，尤其恶感被机器责备。高人一等的话语和责备会让用户觉得 “ 不忿 ”、“ 挫败 ”，甚至会丧失对机器的 “ 信任 ”。

人是社会性植物。日常交往中，我们更喜欢对我们敌对、喜欢我们的人，而倾向远离那些不够友善的人。判别对方能否友善，语音是最直观的线索。在人机语音交互中，我们异样能依据机器的应对判别其能否敌对。因而，话术设计时要注重敌对。

基于此准绳，话术设计时可思索以下几条建议：

建议 1：错误归为机器，而非人

错误发作时，从机器的角度阐明出错缘由。

“会说话的人，一开口就赢了”——语音交互中的机器话术研究

建议 2：防止要求用户依照特定的方式表达

尊重用户的说话方式，不要试图教给用户怎样说话。

“会说话的人，一开口就赢了”——语音交互中的机器话术研究

建议 3：表现 “ 关注用户需求 ” 的效劳态度

即便不能满足用户需求，也要表现出努力协助用户的态度。

“会说话的人，一开口就赢了”——语音交互中的机器话术研究

6. 有特性准绳

必需强调，话术表现的特性必需与产品人设坚持分歧，比方冷静成熟的产品人设就不太合适嗲嗲说话撒娇卖萌的话术。

本次我们发现，用户对 “ 幽默 ” 的话术承受度较高。在人际交往中，幽默能提升别人对本人的印象，让人觉得密切并能协助人们缓解压力。语用学研讨也发现，只需合适特定场景，幽默话语的交际效果是最佳的。

不过，幽默具有分明的文明和群体差别，“ 甲之蜜糖，乙之砒霜 ”，设计话术时需特别留意。

建议 1：遇到难题时，可思索运用幽默话术回应

遇到无法完成的功用时，经过幽默话术回使用户，调理气氛。

“会说话的人，一开口就赢了”——语音交互中的机器话术研究

建议 2：文娱话题的表述可以愈加生动风趣

讨论一些文娱话题或闲谈时，话术可以思索增添更多兴趣元素。

“会说话的人，一开口就赢了”——语音交互中的机器话术研究

四、小结

本文从用户视角动身，论述了机器话术设计的 6 大普适性准绳，以及如何基于这些准绳设计话术。我们定义的设计准绳及提供的设计建议如下：

“会说话的人，一开口就赢了”——语音交互中的机器话术研究

话术研讨具有应战性。话术与对话场景、对象，产品自身的人设、特性，零碎语音辨认、语义了解才能等均具有亲密关系。但这无妨碍我们经过参与式的用户研讨探究话术设计的普适性准绳。所谓 “ 深根固柢 ”，这些准绳是机器话术设计时的根底与根基，有助于我们打造更自然和极致的语音对话体验。

我们也以此研讨为契机，开端探究在 AI 时代，在机器话术这个范畴，如何将技术和艺术、兽性结合，希望能带来让用户内心真正喜欢的体验。

机器话术作为一个充溢艺术特征又与兽性密不可分的主题，还有着许多未知且充溢魅力的方面值得探究。希望本次研讨可以抛砖引玉，引发更多同仁更深化的研讨。

本文被转载1次

首发媒体

| 转发媒体

免责声明：本文章由会员“何书”发布如果文章侵权，请联系我们处理，本站仅提供信息存储空间服务如因作品内容、版权和其他问题请于本站联系

标签：