雷锋网 AI 科技评论按:本文首发于「人工智能THU」,作者钱桥,雷锋网 (大众号:雷锋网) AI 科技评论获受权转载。
ACL 2018, the 56th Annual Meeting of the Association for Computational Linguistics 将于 2018 年 7 月 15 日至 20 日在澳大利亚墨尔本举行。ACL 是自然言语处置范畴的顶级国际会议,被评定为 CCF-A 类会议,起于 1963 年每年举行一次。本届会议共收到 1621 篇投稿(长文 1045 篇,短文 576 篇),录取文章约占投稿总量的 20%。
IJCAI-ECAI 2018, the 27th International Joint Conference on Artificial Intelligence and the 23rd European Conference on Artificial Intelligence 将于 2018 年 7 月 13 日至 19 日在瑞典斯德哥尔摩举行,由 IJCAI、EurAI 和 SAIS 结合发起举行。IJCAI 是人工智能范畴的顶级国际会议,被评定为 CCF-A 类会议。IJCAI 起于 1969 年,每两年举行一次,随着投稿量的添加,2016 年起每年举行一次。本届会议共收到 3470 篇长文投稿,其中 710 篇被录取。
清华大学计算机系对话式人工智能课题组多篇论文被 ACL 2018 和 IJCAI-ECAI 2018 会议录用,触及对话零碎、言语生成、强化学习等范畴。上面是论文列表及引见:
• Generating Informative Responses with Controlled Sentence Function
作者:柯沛、关健、黄民烈、朱小燕
会议:ACL 2018 长文
本文着眼于闲谈对话生成范畴,研讨如何控制生成回复的全局功用特征,并处理功用控制和内容丰厚性的兼容成绩。句子功用(Sentence Function)是一种重要的言语学特征,按句子功用可将言语划分为疑问句、陈说句、祈使句等多个类别,该特征在对话中可以表现说话者的目的。本文引入条件变分自编码器,应用隐变量来建模和控制生成回复的功用特征;同时,我们在模型中设计了类别控制器,解码回复中的每个词之前会先依据隐变量和以后解码形态预测待生成词所属的类别(即功用控制词、话题词或普通词),再依据类别信息解码出相应的词,使得功用特征和内容信息可以在生成的回复中无机结合。自动评测和人工评测的后果标明,我们的模型生成的回复不只在构造上契合设定的功用类别,而且在内容上具有丰厚的信息量。
• Learning to Ask Questions in Open-domain Conversational Systems with Typed Decoders
作者:王延森,刘辰屹,黄民烈,聂礼强
会议:ACL 2018 长文
(本篇文章与山东大学聂教师协作)
本文研讨如何赋予开放范畴对话零碎发问的才能,从而加强闲谈零碎的交互性与继续性。如何提一个好成绩,也较大水平表现了机器了解的才能。我们发现,一个好的发问由三品种型的词构成:疑问词、主题词与普通词,为此我们提出了"类型化解码器"(Soft/Hard Typed Decoder)。在每个解码的地位上,解码器会先决议生成词的类型散布,并应用概率偏置进步生成对应类型词的能够性。关于 Soft 类型化解码器而言,每个解码地位上词的类别散布与词的生成概率散布停止混合;关于 Hard 类型化解码器,我们采用了 Gumbel-Softmax 的概率操作技巧(近似 argmax 功用),使得解码用具有选择静态词表的才能。自动评测和人工评测的后果阐明了我们的模型所生成的发问绝对基线模型具有分明的优势,更容易驱动对话持续下去。
• Commonsense Knowledge Aware Conversation Generation with Graph Attention
作者:周昊,杨天吉,黄民烈,赵海舟,许静芳,朱小燕
会议:IJCAI-ECAI 2018 长文
(本篇文章与搜狗公司许静芳团队协作)
本文研讨如何经过知识知识的引入提升对话模型在开放范畴对话生成义务上的言语了解和生成才能。给定用户输出的语句,对话模型首先从知识知识库中检索出相关的知识图谱,然后运用一种静态的图留意力机制,将这些知识图谱编码成向量输出到编码器中,经过丰厚语义知识从而提升模型对言语的了解才能。在言语生成的进程中,模型经过静态的图留意力机制依据以后解码器形态留意到适宜的知识图谱以及其内的知识三元组,之后选择适宜的知识知识或普通单词去生成,从而增强了模型的言语生成的信息量和知识方面的连接性。自动评测和人工评测后果阐明了我们提出的引入知识知识的对话模型可以生成语义适宜且富有信息量的回复。
• A Weakly Supervised Method for Topic Segmentation and Labeling in Goal-oriented Dialogues via Reinforcement Learning
作者:高信龙一,黄民烈,陈海青,赵中州,李凤麟,朱小燕,聂礼强
会议:IJCAI-ECAI 2018 长文
(本篇文章与阿里巴巴陈海青团队协作)
本文研讨话题构造剖析在了解义务导向性对话上的作用,我们基于弱监视学习对大规模无标签的对话语料停止话题联系与标注,采用深度强化学习办法来建模对聊天对话中意图辨认的将来奖励。模型由一个基于层次化 LSTM 的表示学习网络,和一个在对话主题的部分延续性与全局构造性的奖励序列上完成最优的强化学习网络两局部组成。首先用复杂的先验知识自动对数据停止粗标注,然后经过两个网络的迭代训练来进一步提炼数据。少量实验的评价与剖析证明了我们新提出的训练形式在该义务上有明显的提升。
• Assigning Personality to a Chatting Machine for Coherent Conversation Generation
作者:钱桥 黄民烈 赵海舟 许静芳 朱小燕
会议:IJCAI-ECAI 2018 长文
(本篇文章与搜狗公司许静芳团队协作)
为聊天机器人赋予固定的人物设定是对话范畴的严重应战之一,本文着眼于聊天机器人在提及本身属性时能否可以给出与人设相符的答案,同时保证了前后答复的分歧性。我们提出了一种办法,运用从社交媒体上抓取的通用对话数据训练生成模型,运用有监视的属性检测器 (Profile Detector) 判别用户的成绩能否提及聊天机器人的属性设定,以及详细哪一条预设的属性值。随后运用训练好的双向解码器 (Bidirectional Decoder) 生成包括属性值的回复。此外,为了消弭训练数据与预设属性值不分歧的成绩,我们运用无监视的属性值定位器 (Position Detector) 来协助模型更好地训练。我们同时运用了自动评价和人工评价,实验后果标明我们生成的回复通畅、逻辑正确并且言语多样化。
• Densely Connected CNN with Multi-scale Feature Attention for Text Classification
作者:王诗瑶 黄民烈 邓志东
会议:IJCAI-ECAI 2018 长文
(注:王诗瑶是邓志东教授的博士生,黄民烈教师协作指点该论文任务)
用于文本分类的卷积神经网络大少数采用固定窗口大小的卷积核,因而无法灵敏地学习可变 n-gram 特征。在本文中,我们提出了一种密集衔接的卷积神经网络,其包括基于多尺度特征的留意力模型。密集的衔接树立了底层特征和高层特征之间的跨层衔接,从而发生丰厚的多尺度特征,即可变的 n-gram 特征。此外,我们提出了多尺度特征的留意力模型,使其可以自顺应地选择适宜的特征尺度用于文本分类。实验标明,我们的模型在六个地下数据集上到达了超越基线的效果。留意力模型的可视化进一步提醒了该模型具无为文本分类选择适宜的 n-gram 特征的才能。
雷锋网版权文章,未经受权制止转载。概况见。