继2017年7月刷新世界纪录后,近日,科大讯飞与哈工大结合实验室(HFL)再次在由斯坦福大学发起的机器阅读了解范畴威望评测SQuAD(Stanford Question Answering Dataset)中登顶。此次,讯飞与哈工大结合实验室提交的零碎不只在EM目标(精准婚配率)超越人类均匀程度,并成为首个F1目标(模糊婚配率)上超越89%的零碎。
SQuAD应战赛最新成果榜单
2017年7月,科大讯飞凭仗交互式层叠留意力模型(Interactive AoA Reader)取得该赛事的榜首,并在同年10月进一步优化该模型后再次刷新纪录。此次讯飞与哈工大结合实验室提交的交融式层叠留意力零碎(Hybrid Attention-over-Attention Reader)交融了近期学术界提出的诸多前沿技术,如基于上下文的文本表示、自顺应转随机梯度下降的优化办法等,同时又研收回一些全新技术,不只在SQuAD应战赛中获得亮眼成果,在其他自然言语处置义务上也取得了明显功能提升。
科大讯飞与哈工大结合实验室参赛提交零碎一览
机器阅读了解技术目前曾经成为多家知名企业、高校等研讨机构关注的对象,技术上的打破将带来自然言语了解的长足提高。在与其他研讨机构和高校一同探究技术开展的同时,科大讯飞也在积极推进该项技术在对话、问答零碎中的落地使用,其中一个重要场景就是与智能车载零碎的对话交互的结合,逐渐完成 汽车 范畴的精准问答。经过让机器阅读汽车阐明书及相关的引见资料,使机器深度了解并掌握对该车型的相关知识;在用户提出相关成绩时,不只可以疾速反应给用户相关章节,并且还可以应用阅读了解技术进一步发掘并反应更精准的答案,从而增加用户的阅读量,进步信息获取的速度。
科大讯飞执行总裁胡郁在2017发布会上引见智能车载零碎中阅读技术的使用
科大讯飞不只在SQuAD应战赛继续发力,也关注并积极推进中文信息处置的研讨开展。2017年,科大讯飞携手中国中文信息学会计算言语学专业委员会(CIPS-CL)承办了第一届“讯飞杯”中文机器阅读了解评测(CMRC2017),发布了相关中文阅读了解数据集。往年,科大讯飞将持续与中国中文信息学会计算言语学专委会共同举行第二届“讯飞杯”中文机器阅读了解评测 (CMRC 2018),进一步促进中文机器阅读了解研讨。
拥有宽广使用场景的机器阅读了解技术范畴,将来将有怎样的开展?
科大讯飞初级副总裁、研讨院院长、认知智能国度重点实验室主任胡国平表示,科大讯飞十分快乐看到更多研讨人员参加到机器阅读了解技术的研讨中来。前不久微软亚洲研讨院、阿里巴巴辨别在EM目标上超越人类均匀程度,并且有许多中国团队在榜单中首屈一指,我们对中国研讨机构在这个范畴所获得的好成果表示恭喜。但同时,我我国这片创新热土正在发生一场全面而深刻的产业结构变革。们必需清楚地看法到,虽然目前的零碎在SQuAD应战赛中超越了人类均匀程度,但这并不能代表机器在机器阅读了解义务上“完全”打败了人类。
他表示,真正的阅读了解进程远比我们想象的要复杂,以目前的技术程度还很难做到深层的推理和归结。鉴于此,目前科大讯飞还在积极探究其他类型的阅读了解,例如基于知识、知识的阅读了解以及基于综合线索的阅读了解,并获得了一定的成果。置信在不久的未来,科大讯飞将在机器阅读范畴为大家展现更多的能够。