全国社会媒体处置大会(SMP)由中国中文信息学会社会媒体处置专委会主办,专注于以社会媒体处置为主题的迷信研讨与工程开发,为传达社会媒体处置最新的学术研讨与技术效果提供普遍的交流平台,旨在构建社会媒体处置范畴的产学研生态圈,成为中国乃至世界社会媒体处置的风向标,会议将以社交网络的方式改动传统的学术会议交流体验。第七届全国社会媒体处置大会(SMP 2018)将于8月2日至4日在哈尔滨召开。
本届会议将并行举行三个技术评测竞赛单元:
-
用户画像技术评测 (The evaluation of User Profiling Technology,SMP-EUPT)
-
中文人机对话技术评测 (The evaluation of Chinese Human-Computer Dialogue Technology,SMP-ECDT)
-
文本溯源技术评测 (The evaluation of Text Sourcing Technology,SMP-ETST)
背景简介
用户画像技术评测(SMP-EUPT)
随着机器创作才能越来越强,今后社会媒体上将会发生越来越多的机器创作者自动消费的内容。无效辨认出哪些是人类作者消费的互联网电子商务和移动商务消费渠道的普及,使得支付市场将在不久的将来继续呈现更加美好的增长前景。内容,哪些是机器作者消费的内容,关于媒体内容的审核、分发、引荐等,具有非常重要的意义。
本届用户画像技术评测聚焦于媒体内容创作者画像成绩,由北京字节跳动科技无限公司(昔日头条)提供丰厚的媒体内容数据集,停止作者身份的自动辨认。
中文人机对话技术评测(SMP-ECDT)
人机对话技术近年来遭到了学术界和产业界的普遍关注。学术上,人机对话是人机交互最自然的方式之一,其开展影响并推进着语音辨认与分解、自然言语了解、对话管理以及自然言语生成等研讨的停顿;产业上,众多产业界巨头相继推出了人机对话技术相关产品,如团体事务助理、虚拟情感陪护机器人、文娱型聊天机器人等等,并将人机对话技术作为其公司的重点研发方向。
本届中文人机对话技术评测将聚焦于用户意图的辨认和呼应成绩,以科大讯飞股份无限公司提供的数据集为根底,辨别展开用户意图范畴分类和特定范畴义务型人机对话在线评测。
文本溯源技术评测(SMP-ETST)
文本溯源的目的是判别一个文本的内容能否复制或改编于另外一个或许多个文件。文本溯源技术在学术诚信检测、搜索引擎优化等范畴有普遍使用。
本届文本溯源技术评测以科研立项或效果创新型审查为使用背景,以著名的学术搜索零碎 AMiner 提供的少量中文论文摘要数据为根底,停止句子溯源技术评测。
义务描绘
评测单元 | 义务描绘 |
用户画像 | 给定一个由若干媒体内容文档构成的数据集,参赛队伍采用适当的算法,对每篇文档的作者停止身份辨认,区分出该文档属于人类写作、机器写作、机器翻译和机器自动摘要中的哪一类。 |
中文人机对话 |
义务 1:用户意图范畴分类
在人机对话零碎的使用进程中,用户能够会有多种意图,相应地会触发人机对话零碎中的多个范畴(domain),包括义务型垂直范畴(如查询机票、酒店、公交车等)、知识型问答以及闲谈等。本义务的目的就是正确地将用户的输出分类到正取的范畴(domain)中。 义务 2:特定域义务型人机对话在线评测针对特定域的义务型人机对话零碎,人工实时在线对话交互及评价可以反映零碎关于用户意图呼应的功能以及用户真实的称心度。本义务的目的是面向特定范畴的义务型人机对话在线评测。 |
文本溯源 | 本次文本溯源技术评测的义务是句子级的检测,即给定一批待查句子和一个源数据集,判别待查句子能否改编自源数据集中的句子,假如是则找出相应的源句子。句子改编的范围包括但不限于:微修正、添加、局部删简、对文字表述停止概括、改动原有的陈列顺序、关键词交换等。 |
数据集阐明
-
用户画像技术评测数据集由昔日头条提供,中文人机对话技术评测数据集由科大讯飞提供,文本溯源技术评测数据集由清华大学 AMiner 零碎提供。一切数据集仅限于本次技术评测运用,未经答应不能用于任何其他目的和任何中央,不得汇编入其他数据集或数据库。如需将某数据集用于其他课题研讨及宣布论文,需与评测主办方联络获得答应前方可运用。
-
数据集的详细内容、范围、规模及格式以最终发布的真实数据集为准。
-
训练集用于模型的学习,验证集用于在线实时评价算法效果,评测集用于最终的效果评测。其中验证集和评测集的标签信息不地下发布,用于组委会停止在线实时评测和最终评测。
重要日期
用户画像
4 月 15 日:发布评测方案,开端报名
5 月 05 日:发布训练集
6 月 01 日:发布验证集,开端提交两头后果并发布周排行榜
6 月 30 日:中止提交验证集两头后果
7 月 01 日:发布评测集,提交最终评测后果(1 天之内完成)
8 月 04 日:技术评测论坛(揭晓获奖名单+颁奖+技术报告)
中文人机对话
4 月 01 日:开端预告名
4 月 11 日:开端正式报名
5 月 01 日:发布训练及开发集
5 月 02 日:开端零碎搭建及调整
7 月 13 日:提交义务 1 最终评测后果(1 天之内完成)
7 月 14 日:提交义务 2 最终评测后果(3 天之内完成)
8 月 04 日:技术评测论坛(揭晓获奖名单+颁奖+技术报告)
文本溯源
5 月 03 日:发布评测方案,开端报名
5 月 15 日:发布训练集
6 月 01 日:发布验证集,开端提交验证集两头后果
6 月 30 日:中止提交验证集两头后果
7 月 01 日:发布评测集,提交最终评测后果(1 天之内完成)
8 月 04 日:技术评测论坛(揭晓获奖名单+颁奖+技术报告)
奖励
评测单元
|
奖励
|
用户画像 |
A. 奖金
一等奖 1 名:10000 元
二等奖 2 名:每名 5000 元
三等奖 3 名:每名 3000 元
B. 奖励
获奖者可取得直接面试昔日头条 AI Lab 的时机
|
中文人机对话 |
A. 义务 1
第 1 名:6000 元
第 2 名:4000 元
第 3 名:2000 元
B. 义务 2
第 1 名:10000 元
第 2 名:8000 元
|
文本溯源 |
一等奖 1 名:20000 元
二等奖 2 名:每名 10000 元
|
组织者
主办单位:
中国中文信息学会社会媒体处置专业委员会
评测指点:
刘 挺 哈尔滨工业大学
唐 杰 清华大学
李 航 北京字节跳动科技无限公司(昔日头条)
承办单位:
用户画像:
北京交通大学网络迷信与智能零碎研讨所
北京字节跳动科技无限公司(昔日头条)
中文人机对话:
哈尔滨工业大学社会计算与信息检索研讨中心
科大讯飞股份无限公司(iFLYTEK)
文本溯源:
军事迷信院军事迷信信息研讨中心
清华大学计算机系 AMiner 团队
评测主席:
蒋盛益 广东外语外贸大学
万怀宇 北京交通大学(用户画像)
张伟男 哈尔滨工业大学(中文人机对话)
蔡 超 军事迷信院军事迷信信息研讨中心(文本溯源)
评测委员:(按姓氏笔画排序)
用户画像 |
李 磊 北京字节跳动科技无限公司
沙 灜 中国迷信院信息工程研讨所
周 浩 北京字节跳动科技无限公司
|
中文人机对话 |
车万翔 哈尔滨工业大学
陈志刚 科大讯飞股份无限公司
|
文本溯源 |
邓志鸿 北京大学
齐浩亮 黑龙江工程学院
宋 驰 清华大学
周玉秀 军事迷信院军事迷信信息研讨中心
|
参赛入口:
http://smp2018.cips-smp.org/smpcup.html
相关文章:
全国社会媒体处置大会行将召开,一文详解四天议程精髓 | SMP 2017
电子科大周涛教授:事先代发作剧变,一定要站在可以发生严重效果的中央 | SMP 2017
大数据时代社会迷信在发作剧变,六年来SMP如何基于兴味驱动促进学科开展? | SMP 2017
国际首届中文人机对话技术评测赛果出炉,两项义务冠军团队都分享了哪些技术细节?|SMP 2017
【重磅开幕】SMP2018之第二届中文人机对话技术评测(ECDT)
雷锋网版权文章,未经受权制止转载。概况见。