自然言语处置顶会 NAACL 2018 最佳论文、工夫检验论文揭晓

2025-08-05 01:39:50

导读雷锋网(大众号：雷锋网)AI 科技评论按：ACL、EMNLP、NAACL - HLT、COLING 是 NLP 范畴的四大顶会。前三者都由 ACL（Association of Computational Linguistics）举行，其中 NAACL - HLT（Annual Conference of the North American Chapter of the Association

自然语言处理顶会 NAACL 2018 最佳论文、时间检验论文揭晓雷锋网 (大众号：雷锋网) AI 科技评论按：ACL、EMNLP、NAACL - HLT、COLING 是 NLP 范畴的四大顶会。前三者都由 ACL（Association of Computational Linguistics）举行，其中 NAACL - HLT（Annual Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies，普通简称为 NAACL）虽然名义上只是 ACL 北美分会，但在 NLP 圈里也是无可争议的顶级会议，称号中的 HLT 也直接宣告了关于人类言语处置技术的关注。

第 16 届 NAACL （NAACL 2018）将于往年 6 月 1 日至 6 月 6 日在美国路易斯安那州新奥尔良市举行，承受论文名单曾经发布，共收到长论文投稿 647 篇，其中承受 207 篇，承受率 32%；短论文投稿 425 篇，承受 125 篇，承受率 29%。会议官网也曾经提早揭晓了本届会议的 4 篇出色论文（Outstanding Papers）和 3 篇工夫检验奖获奖论文（Test-of-Time Award Papers）。

Outstanding Papers

Deep Contextualized Word Representations

深度上下文单词表征
地址： https://arxiv.org/abs/1802.05365
摘要：本文中作者们引见了一种新的深度上下文单词表征，它可以建模（1）单词用法中的复杂特性（比方句法和语义），以及（2）这些用法在不同的言语上下文中如何变化（比方为词的多义性建模）。作者们在大文本语料库上预训练了一个深度双向言语模型（biLM），然后把依据它的外部形态学到的函数作为词向量。作者们标明，这些学到的词表征可以随便地参加到现有的模型中，并在答复成绩、文本包含、情感剖析等 6 个不同的有难度的 NLP 成绩中大幅进步最佳表现。作者们也停止了剖析，标明显显露预训练模型的深度外部形态这一做法十分重要，这使得后续的模型可以混合不同品种的半监视信号。

Learning to Map Context-Dependent Sentences to Executable Formal Queries

学习把基于上下文的语句映射为可执行的正式查询
地址： https://arxiv.org/abs/1804.06868
摘要：论文中作者们提出了一种基于上下文的模型，用来把一组交互对话中的语句映射为可以执行的正式查询语句。为了把交互进程的历史也包括在内，模型中维持着一个交互对话级别的编码器，它会在每轮对话完毕后更新，也可以在生成进程中拷贝之前已经预测过的查询语句中的子序列。论文中的办法兼并了语句之间的显示参照和隐式参照。作者们在 ATIS 航班规划交互上评价了模型，展示出了上下文建模和显式参照的优势。

Neural Text Generation in Stories using Entity Representations as Context

把实体表征作为上下文的叙说文体中的神经文本生成
地址： https://jiyfeng.github.io/publication/papers/clark2018neural.pdf
摘要：作者们引见了一种神经文本生成办法，它可以显式地表示出文本中提到的实体。实体表征是向量的方式，它们可以随着文本处置进程更新；实体表征是专门为小说或许新闻故事这样的叙说性文本设计的。作者们的实验标明，为实体建模的做法可以在以下两个自动化测试中带来益处：提及生成，即模型需求选择下回到当下汹涌澎湃的AI浪潮，正如所有的企业都被互联网化一样，所有的互联网企业都将 AI 化。而这些互联网企业中，也包含CSDN。同时，作为全球最大的中文IT社区，CSDN还有一个历史使命——为广大的互联网公司进行AI赋能。一个要提及的实体是什么，提及时又需求用哪个词；以及在正确的下一句和来自同一个故事的更靠后的一句之间停止选择。作者们也人工评价了在故事上下文中自动生成的文本，研讨后果与作者们希望强调实体的想法相符，并为将来研讨指出了方向。

Recurrent Neural Networks as Weighted Language Recognizers

把循环神经网络作为加权言语辨认器的研讨
地址： https://arxiv.org/abs/1711.05408
摘要：论文中作者们探求了复杂的循环神经网络（RNNs）作为正式模型辨认加权言语时的不同成绩的计算复杂度。作者们重点关注的模型是单层、ReLU 激活函数、有理数权重、带 softmax 的 RNN 网络，这种网络在自然言语处置使用中十分罕见。作者们标明关于这样的 RNN 来说，少数的成绩都是不可断定的，比方分歧性、等价性、最小化以及权重最高的字符串确实定性。但是，关于分歧性 RNN 来说，这最初一个成绩是可以断定的，虽然处理方案的长度会超出一切计算范围。假如附加条件限定字符串为多项式长度，这个成绩变为 NP-complete 以及 APX-hard。总结来说，这标明这种 RNN 的实践使用中近似和启示性算法是必需的。

Test-of-Time Award Papers

雷锋网 AI 科技评论留意到，实践上这是 NAACL 会议初次设立工夫检验奖，论文选择范围为 2002-2012 年 ACL 的各个会议（包括 ACL, NAACL, EACL, EMNLP 和 CONLL）、workshop 以及期刊（TACL 和 CL journal）中的关于计算言语学（Computational Linguistics）的论文，意在惩处直到明天都对计算言语学范畴有明显、临时影响的论文。在 NAACL 2018 区域主席提名的 19 篇有利益抵触的论文中，最终选出了如下三篇论文，也都的确很值得回味。

BLEU: a Method for Automatic evaluation of Machine Translation

BLEU：一种自动化评价机器翻译的办法
地址： https://www.aclweb.org/anthology/P02-1040.pdf
来源：ACL 2002
摘要：假如让人类对机器翻译的后果做评价，虽然拓展性好但较为昂贵。人类评价的进程能够需求好几个月的工夫，其中触及的人类休息也无法重复运用。这篇论文中提出了一种自动的机器翻译评价办法，它疾速、廉价、不依赖于言语，它的评价后果与人类的评价后果高度吻合，而且运转本钱相当低。作者们提出的这种办法可以作为有经历的人类评价者的自动化备用办法，在有需求做疾速、频繁的评价时就可以运用它。

Discriminative Training Methods for Hidden Markov Models: Theory and Experiments with Perceptron Algorithms

隐马尔可夫模型的判别性训练办法：感知机算法的实际和实验
地址： http://www.aclweb.org/anthology/W02-1001
来源：EMNLP 2002
摘要：作者提出了一种新的算法用于训练分类模型，它可以作为最大熵模型或许条件随机场模型（CRFs）的替代办法。这种算法依托的是训练样本的 Viterbi 解码，并且结合了复杂的加式更新。作者对感知机算法关于分类成绩的收敛性的证明加以修正，据此实际证明了算法。作者在语音段分类和根底名词短语分块义务上停止了实验，所提的办法表现都要优于最大熵分类器。

Thumbs up?: Sentiment Classification using Machine Learning Techniques

你说好不好？机器学习办法的情感分类
地址： http://www.aclweb.org/anthology/W02-1011
来源：EMNLP 2002
摘要：论文中研讨了这样一个成绩，文档分类的根据不再依照话题，而是依照总体感情，比方判别一句评论是正面的还是负面的。把电影评论作为数据，作者们发现规范的机器学习技术明白地优于人类设计的基准模型。但是，作者们实验的三种机器学习办法（朴素贝叶斯，最大熵分类，SVM）在情感分类义务中的表现并不如在传统的基于话题的分类义务中表现好。作者们还验证了几个使得情感分类比话题分类更难的要素。

via NAACL Chair's Blog ，雷锋网 AI 科技评论编译

雷锋网版权文章，未经受权制止转载。概况见。

免责声明：本文章由会员“陈书”发布如果文章侵权，请联系我们处理，本站仅提供信息存储空间服务如因作品内容、版权和其他问题请于本站联系

标签：