2018年伊始,人工智能获得严重打破!1月11日,由斯坦福大学发起的机器阅读了解范畴顶级赛事SQuAD刷新排名,令业界振奋的是人工智能的阅读才能历史上初次逾越人类。 阿里巴巴凭仗82.440的精准率打破了世界纪录,并且逾越了人类82.304的成果。
SQuAD的担任人Pranav Rajpurkar难掩兴奋之情。他在社交媒体上表示,2018年一个微弱的开端,第一个模型(阿里巴巴iDST团队提交的SLQA +)在精准度婚配上逾越人类表现!下一个应战:模糊婚配,人类依然抢先2.5分!
SQuAD竞赛构建了一个大规模的机器阅读了解数据集(包括10万个成绩),文章来源于500多篇维基百科文章。
人工智能在阅读完数据集中的一篇短文之后,需求答复若干个基于文章内容的成绩,然后与规范答案停止比对,得出准确婚配(Exact Match)和模糊婚配(F1-score)的后果。
SQuAD是行业内公认的机器阅读了解顶级赛事,吸引了包括谷歌、卡内基.梅隆大学、斯坦福大学、微软亚洲研讨院、艾伦研讨院、IBM、Facebook等知名企业研讨机构和高校的深度参与。
此次技术的严重打破源于阿里巴巴研讨团队提出的“基于分层交融留意力机制”的深度神经网络模型。该模型可以模仿人类在做阅读了解成绩时的一些行为,包括结合篇章内容审题,带着成绩重复阅读文章,防止阅读中遗忘而停止相关标注等。
模型可以在捕获成绩和文章中特定区域关联的同时,借助分层战略,逐渐集中留意力,使答案边界明晰;另一方面,为防止过于关注细节,采用交融方式将全局信息参加留意力机制,停止过度纠正,确保关注点正确。
阿里巴巴自然言语处置首席迷信家司罗表示,关于处理wiki类客观知识问答,机器曾经获得十分好的后果,我们将持续向对通用内容的“能了解会考虑”的终极目的迈进。
今后,研发的重点在于把这项技术真正使用在广阔实践场景,让机器智能普惠生活。
实事上, 这项技术曾经在阿里巴巴外部被普遍运用。比方,每年双11都会有少量的顾客对活动规则停止征询。阿里小蜜团队经过运用司罗团队的技术,让机器直接对规则停止阅读,为用户提供规则解读效劳,是最自然的交互方式。
再比方,顾客还会针对单个商品讯问少量的根底成绩,而这些成绩其真实商品概况页都是有答案的。如今经过机器阅读了解技术,可以让机器对概况页中的商品描绘文本停止更为智能地阅读和答复,降低效劳本钱的同时进步购置转化率。
由司罗指导的自然言语处置团队支撑了阿里巴巴整个生态的技术需求。由他们研发的AliNLP自然言语技术平台每日调用1200亿+次,Alitranx 翻译零碎提供20个语种在线效劳日调用量超越7亿+次。
此前曾在2016年ACM CIKM 特性化电商搜索、2017年IJCNLP中文语法检测CGED评测、2017年年美国规范计量局TAC评选英文实体分类等大赛中获得全球第一的成果。
责编:陶文冬