“假如机器在某些理想的条件下 , 可以十分好地模拟人答复成绩 , 让发问者在相当长工夫里误认它不是机器, 那么机器就可以被以为是可以思想的 。”
—— 阿兰·图灵
“ 一团体的成功 , 约有 15% 取决于技术知识 ,85% 取决于口才艺术 。”
—— 戴尔·卡耐基
“ 与机器像和人一样对话” 大约是人类对人工智能最后的想象 , 也是人类希望在人工智能范畴完成的目的 。
在不少科幻电影或小说里, 人工智能可以和人自然交流 , 甚至可以谈情说爱 ( 如电影 《her》中的萨曼莎 )。 但我们不得不供认 , 理想和理想差距很大 。 如今的人工智能虽然曾经 “可以说话 ”, 但大少数都 “ 不会说话 ”, 我们常常可以听到 “ 这个成绩我还了解不了 , 假如你想……,可以这样对我说……”。
为了教会机器“ 像人一样说话 ”, 人们在语音辨认 、 自然言语了解 、 语音分解等诸多方面停止了少量探究 , 但这些探究次要集中在技术维度 , 而对机器话术涉猎较少 。
在汉语中 ,“ 术” 有技艺 、 办法之意 , 话术即指说话的技艺和办法 。 和技术相比 , 话术更偏艺术和兽性 。 乔布斯说 “ 只要技术是不够的——技术与人文艺 术结合 、 与兽性结合 , 才干带来让我们内心喜欢的后果 ”。 因而 , 我们本次从用户视角动身 , 尝试 从艺术和兽性的角度对话术停止探究 。
研讨次要包括以下内容 :
话术设计研讨: 我们如何做的
话术设计准绳:用户关注什么 ? 哪个更重要
话术设计建议:准绳如何指点话术设计
一 、 话术设计研讨: 我们如何做的 ?
当下的话术研讨多从研讨者视角动身,准绳次要源自研讨者的日常察看 、 哲学思辩和专业判别。 本次 , 我们从用户视角动身来讨论话术 ,研讨进程如下 :
1. 案头研讨
我们对人与人的对话构造和对话准绳停止了零碎梳理, 特别引荐 Grice 的 “ 协作准绳”( 出自 《逻辑与会话 》 演讲 ,1967) 和索振羽的 “ 得体准绳”( 出自 《 语用学教程 》 第二版,2014)。 这一步至关重要 , 它加深了我们对 “对话” 的了解 , 这些准绳也成为我们设计实验话术时的重要参考根据 。
2. 对话场景设计
为掩盖尽能够多的场景, 我们零碎梳理了语音交互的典型场景 , 如听音乐 、 问天气 、 家居控制 、 生活效劳等 。 同时 , 每个场景下也细分了机器的不同形态 , 如能否听清 、 能否辨认 、能否有才能满足等 。
3. 详细话术设计
对话场景梳理明晰后, 我们针对每个场景设计实验所需话术 。 话术来源次要有二 , 一是主流语音交互产品的现有话术 , 二是研讨者基于人与人的对话准绳撰写而成的话术 。
4. 话术实验
上述预备完成后, 进入正式实验阶段 。 在实验中 , 我们创设了各类场景 ( 详细场景见 “对话场景设计” 局部 ), 并且模仿了真实的人机对话进程 ( 一切实验话术均转为语音分解音停止播报 ), 要求用户基于真实体验对不同场景下每类话术的爱好度停止评价 。
同时, 我们运用了 “ 参与式设计”, 以“ 假设你是机器, 你会如何答复 ” 为终点 , 引导用户更深地参与到话术设计中 , 共同讨论实验话术以及更为理想的表 达方式 。 这一进程使我们取得了少量源自用户的鲜活话术 , 也使我们能从更丰厚的角度发掘用户构建话术的准绳、 办法与技巧 。
5. 设计准绳提炼与验证
基于案头研讨和实验发现 , 我们提炼了初步的设计准绳。 之后 , 要求用户对准绳的可了解性、 片面性 、 适用性等停止评价 。 经过多轮评价 , 我们不时调整准绳, 最终取得了如今的话术设计准绳。
二、 话术设计准绳:用户关注什么 ? 哪个更重要 ?
我们发现, 在用户心中 , 好的话术要统筹感性和理性准绳。 感性准绳表现在 “机器的话是有用的 ”, 话术应该是以目的为中心 、 精确 、 简约的 ; 理性准绳强调 “对话进程令人愉悦 ”, 话术应该是自然 、 敌对 、 有特性的 。
同时, 我们要求用户基于本身体验对各准绳的重要性停止了 1 -10 级评价 , 其中 1 分代表十分不重要 ,10 分代表十分重要, 分数越高 , 重要性越高 。
后果发现, 现阶段 ,用户更看重感性准绳, 尤其是以目的为中心 , 精确 , 而自 然 、 敌对等理性准绳暂居绝对主要的地位 。
此外 , 我们也梳理了不同准绳下的详细评价目标 , 这些目标代表在该准绳下 ,用户在对话中详细的关注点 。 不同目标的重要性有所不同 , 详见下表 。
三、 话术设计建议:准绳如何指点话术设计?
接上去, 我们一同看看上述这些准绳如何指点详细的机器话术设计。
1. 以目的为中心准绳
以目的为中心是用户最为看重的准绳。用户十分注重效率 ( 闲谈场景除外 ), 他们希望机器的回复与本人的需求高相关 ,可以疾速达故意中所想 。
同时,用户表示在语音交互中 , 需求更多 “ 引导 ”, 尤其需求理解机器当下和将来形态 。 语音看不见摸不着 , 我们无法像在图形用户界面 (GUI) 中那样——经过导航条判别所在的地位 ,看到按钮可以判别能否点击等 。 假如短少必要的引导 ,用户在语音交互中很容易迷茫 , 发生各类负面心情 。
因而, 话术设计时 , 必需遵照以目的为中心准绳, 做好引导 , 让用户可以经过声响 “ 看到 ”通往需求的途径 。 基于此准绳,设计话术时可思索以下几条建议:
建议 1: 优先回使用户的中心意图
围绕用户最关怀的成绩优先给出合适的回应 。
建议 2: 清楚传达机器以后的状况
假如由于各种缘由无法直接满足用户需求时 , 应及时告知 , 防止用户困惑 。
建议 3: 廓清目的 , 不随便终结对话
对话进程中 , 引导用户不时廓清目的 , 不随便做话题的终结者 。
建议 4: 通知用户接上去怎样做
不能明晰辨认用户意图时 , 可自动讯问用户有能够的意图 , 引导用户完成目的 。
建议 5: 提供相关替代方案
在无法直接满足用户时 , 可思索提供相关度较高的替代方案 , 直接满足用户。
2. 精确准绳
用户以为表达精确是最根本的准绳。 表述不精确能够招致用户曲解 、 无法判别机器所要传达的真正含义 , 使对话脱离正轨甚至无法停止 。
基于精确准绳,设计话术时可思索以下建议:
建议 1: 防止表述有歧义
表述的含义要确定, 不要说让用户“ 这样了解可以, 那样了解也可以” 的话 。 口语中最罕见的歧义是同音歧义 , 即语音相反带来的歧义 。 以下两类同音歧义 , 话术设计时需求留意 :
同音异形词歧义, 如播放菜谱时提到 “ 切 ji 放糖 ”, 是“ 记 ” 还是 “ 忌 ”?
同音同形词歧义 , 如闲谈时提到 “ 我最喜欢杜鹃啦 ”, 是杜鹃这种花还是杜鹃这种鸟 ?
建议 2: 防止表述过于笼统模糊
表述要尽能够详细明白 , 防止过于笼统模糊 。
我们来看上面一个案例,研讨中 , 面对第一种话术 , 大少数用户表示 “ 有点懵 ”,“ 是给音箱起名字, 还是通知音箱本人的名字 ? 不晓得该怎样答复 ”。 而第二种话术则明白指出是 “ 音箱对本人的称谓 ”。
3. 简约准绳
在研讨中 ,用户屡次提到 “ 不喜欢这个话术 , 太啰嗦了 , 能不能 拣 重点说 ”,“ 说太多了 ,压根没记住啊 ”, 这些埋怨表现了用户对简约的注重 。
用户如此注重简约是必定的。 语音是一维线性的 , 只能一个字一个字的听完 , 无法快进 , 不能前进 。 哪怕信息不相关 、 有意义 ,用户都无法略过 。 这些冗余信息既糜费用户工夫 , 也会添加用户的焦躁心情 。
更重要的是, 大脑能处置的语音信息量无限 , 一旦超出会给人的任务记忆形成担负 。 临时以来 , 神奇数字 7±2 被以为是任务记忆的容量 , 但近期这一规范遭到质疑 , 普遍以为这一估量偏高 。 有研讨者 (Mastin,2010) 以为这一数字能够是 4±1。
基于此准绳,设计话术时可思索以下几条建议:
建议 1: 表述复杂明了 , 不啰嗦
传递必要信息前提下 , 坚持话术简约 。
建议 2: 防止信息量过大 , 一次提供的选项不超越三个
单次交互提供的信息量不要过大 , 以免给用户形成认知和记忆担负 。
4. 自然准绳
在研讨中, 听到某些话术 ,用户纷繁表示 “ 这太僵硬了 , 一点都不自然 ”,“ 这分明就是机器说的话 , 人怎样能够这么说呢 ”。用户希望话术可以贴近生活 , 尽能够自然 。
这是十分好了解的。 在人机语音交互中 , 人类最想运用的一定是自然言语 。 行动言语是人类最擅长 , 运用门槛最低的自然言语 , 人类运用行动言语停止交流的历史已跨越十万年 。 与之相比 , 口语言的开展不过五千年 , 计算机言语更是刚刚萌芽 。 因而 ,设计话术时 , 可参考汉语行动言语的特点 , 营建 “ 自然感 ”。
基于此准绳,设计话术时可思索以下几条建议:
建议 1: 措辞口语化
日常对话中 , 我们会运用丰厚多彩的堆叠词 ( 如看看 、 马下马上 )、 语气词 ( 如吧 、 呢、哈 )、 感慨词 ( 如哎 ! 天 !)、 活灵活现的象声词 ( 如噗通 、 呼啦 )、 填补词 ( 如嗯, 呃 ), 也会妙用各种副言语 , 如 “ 哼哼 ” 之类的鼻化音 、 笑声 、 颤音等等 。 话术设计中,可以参考这些口语化的表达 。
尤其留意 , 话术设计时要尽能够防止专业术语 、 技术名词 、 流畅用语等 。
建议 2: 句式自然 , 可运用话语标志
口语中句子多短小 , 构造复杂 。 言语学研讨发现 , 口语中长句占比仅 19%, 短句占比到达 81%(超越 7 个虚词的单句为长句 , 反之为短句 。 虚词指具有实践含义且能独自充任句子成分的词 )。 话术设计时可思索这一特点 , 尽能够运用短句 。
另外 , 口语对话中会运用 “ 话语标志语 ” 做句子之间的过渡 , 话术设计时也可参考 。 罕见的话语标志有 :“ 首先…然后…最初 ” 之类的序列标志 ;“ 开端 ”、“ 当前 ” 之类的工夫标志 ;“这”、“ 那 ” 之类的指示词等 。
建议 3: 添加措辞多样性
运用同义词为固定的答案添加多样性 , 比方表示确认的时分 ,可以随机出现 “ok”、“ 收到 ”、“好的 ”、“ 没成绩 ” 等等 。 这些同义词可以添加对话生机 , 让对话更自然 。
5. 敌对准绳
研讨中, 我们发现 ,用户很恶感机器以 “ 高人一等 ” 的姿势说话 , 尤其恶感被机器责备 。 高人一等的话语和责备会让用户觉得 “ 不忿 ”、“ 挫败 ”, 甚至会丧失对机器的 “ 信任 ”。
人是社会性植物。 日常交往中 , 我们更喜欢对我们敌对 、 喜欢我们的人 , 而倾向远离那些不够友善的人 。 判别对方能否友善 , 语音是最直观的线索 。 在人机语音交互中 , 我们异样能依据机器的应对判别其能否敌对 。 因而 , 话术设计时要注重敌对 。
基于此准绳, 话术设计时可思索以下几条建议:
建议 1: 错误归为机器, 而非人
错误发作时 , 从机器的角度阐明出错缘由 。
建议 2: 防止要求用户依照特定的方式表达
尊重用户的说话方式 , 不要试图教给用户怎样说话 。
建议 3: 表现 “ 关注用户需求 ” 的效劳态度
即便不能满足用户需求 , 也要表现出努力协助用户的态度 。
6. 有特性准绳
必需强调, 话术表现的特性必需与产品人设坚持分歧 , 比方冷静成熟的产品人设就不太合适嗲嗲说话撒娇卖萌的话术 。
本次我们发现,用户对 “ 幽默 ” 的话术承受度较高 。 在人际交往中 , 幽默能提升别人对本人的印象 , 让人觉得密切并能协助人们缓解压力 。 语用学研讨也发现 , 只需合适特定场景 , 幽默话语的交际效果是最佳的 。
不过, 幽默具有分明的文明和群体差别 ,“ 甲之蜜糖 , 乙之砒霜 ”,设计话术时需特别留意 。
建议 1: 遇到难题时 , 可思索运用幽默话术回应
遇到无法完成的功用时 , 经过幽默话术回使用户, 调理气氛 。
建议 2: 文娱话题的表述可以愈加生动风趣
讨论一些文娱话题或闲谈时 , 话术可以思索增添更多兴趣元素 。
四、 小结
本文从用户视角动身 , 论述了机器话术设计的 6 大普适性准绳, 以及如何基于这些准绳设计话术 。 我们定义的设计准绳及提供的设计建议如下 :
话术研讨具有应战性。 话术与对话场景 、 对象 , 产品自身的人设 、 特性 , 零碎语音辨认 、语义了解才能等均具有亲密关系 。 但这无妨碍我们经过参与式的用户研讨探究话术设计的普适性准绳。 所谓 “ 深根固柢 ”, 这些准绳是机器话术设计时的根底与根基 , 有助于我们打造更自然和极致的语音对话体验 。
我们也以此研讨为契机, 开端探究在 AI 时代 , 在机器话术这个范畴 , 如何将技术和艺术 、兽性结合 , 希望能带来让用户内心真正喜欢的体验 。
机器话术作为一个充溢艺术特征又与兽性密不可分的主题, 还有着许多未知且充溢魅力的方面值得探究 。 希望本次研讨可以抛砖引玉 , 引发更多同仁更深化的研讨。