农企新闻网

击败金牌速记员,阿里云ET当起了书记员和法官的“小助手”-天下网商-赋能网商,成就网商

发布者:张俊东
导读摘要:2017年被称为阿里云的产业AI之年,ET大脑在城市、司法、工业等范畴疾速落地。阿里云ET大脑取得世界互联网抢先科技效果奖,阿里巴巴集团CEO张勇发布并领奖。 文/ 天下网商记者 孙茜茜 编辑/ 翁菲 阿尔法狗击败李世石,阿里云人工智能ET击败金牌速记员 2016年3月23日,一场人机大战在阿里云的年会上演出了。 在阿里云总裁胡晓明演讲环节,来自阿里iDST团队的“实时语音辨认零
摘要:2017年被称为阿里云的产业AI之年,ET大脑在城市、司法、工业等范畴疾速落地。

击败金牌速记员,阿里云ET当起了书记员和法官的“小助手”-天下网商-赋能网商,成就网商阿里云ET大脑取得世界互联网抢先科技效果奖,阿里巴巴集团CEO张勇发布并领奖。

文/ 天下网商记者 孙茜茜

编辑/ 翁菲

阿尔法狗击败李世石,阿里云人工智能ET击败金牌速记员

2016年3月23日,一场人机大战在阿里云的年会上演出了。

在阿里云总裁胡晓明演讲环节,来自阿里iDST团队的“实时语音辨认零碎”对战常伴马云身旁的金牌速记师姜毅,辨别给出演讲的文本内容,同时投屏,现场PK正确率。

姜毅在阿里云的同窗们眼中是这样一种存在:“神普通的速录师,拥有超人的短时记忆功用,超级的打字速度和惊人的正确率”。

姜毅曾在世界速记竞赛中取得亚军,他可以在演讲者每分钟300字的语速下, 边听边打字, “话音落、字表现”。

阿里云的同窗算了一笔账,每秒钟除标点符号、回车、删除、正文外,他能敲5个字。“依照均匀一个字敲4次键盘来说, 也就是每秒钟20次的敲击速度!同时还能在各种搅扰下保证九十几以上的正确率!”

单方PK了7分50秒,“实时语音辨认零碎”最终以0.67%险胜。

iDST语音技术总监鄢志杰说,速记员愈加信达雅,但人类很难继续坚持更长工夫的高强度脑力休息。机器虽然犯一些语义了解上的错误,但是可以一字不落地记载下讲话内容。并且,在电路迟滞的状况下,机器可以任务24小时。

击败金牌速记员,阿里云ET当起了书记员和法官的“小助手”-天下网商-赋能网商,成就网商

iDST语音技术总监鄢志杰

ET入驻法院,当起了书记员和法官的“小助手”

对法庭中的书记员来说,他们能否有速记跟不上法庭节拍的痛点?“实时语音辨认零碎”能否可以提供协助?不久后,这项技术被引入了浙江高院。

据《人民法院报》报道,2016年5月,浙江高院率先开发启用智能语音辨认零碎,运用人只需点击事前装置在电脑桌面上的软件即完成“一键开启”。软件事后设置角色,语音文字转换时自动注明发言人角色,自动区分庭审发言对象及发言内容。

2016年6月7日上午,西湖区人民法院作为浙江高院智能语音辨认零碎试点,完成了首例庭审语音同步转化为文字并生成庭审笔录的案件,精确率达96.2%。

击败金牌速记员,阿里云ET当起了书记员和法官的“小助手”-天下网商-赋能网商,成就网商

西湖区人民法院庭审现场

早在2015年11月,浙江省高院与阿里就签署了战略协作框架协议,单方共同展开云计算和大数据相关范畴的技术与使用研讨,完成新一代信息技术与浙江审讯执行任务各范畴的深度交融。2016年9月13日,浙江省高院宣布,将在全省105家法院片面上线智能语音辨认零碎。

据悉,目前阿里云人工智能ET曾经为全国近300家法院、超越6000个法庭提供庭审语音转写效劳。

2017年12月6日,福建省初级人民法院正式引入ET。以智能语音为切入点,将语音辨认与大数据剖析结合,发掘司法大数据的价值,推进审讯体系和审讯才能古代化。

击败金牌速记员,阿里云ET当起了书记员和法官的“小助手”-天下网商-赋能网商,成就网商

福建省初级人民法院与阿里战略协作签约典礼

据悉,除了对庭审进程停止“原汁原味”的记载外,ET将担任法官“小助手”。结合语音文本、判决文书、历史案例库等相关文本数据,经过大数据发掘、文本发掘、机器学习建模技术等,提供类似案例的剖析与检索、案情建模、案由提取、争议点发掘、智能预判等,协助法官判案,最大限制消弭或增加“同案不同判”的景象发作。

数千家智慧法庭是一夕之间冒出来的吗?

数千家智慧法庭是一夕之间冒出来的吗?鄢志杰说,不是的,这离不开技术的成熟度和积聚。

单就语音技术而言,阿里从2014年起就十分严肃地在做投入了,不论是人才、数据还是计算上的投入。“技术、算法,最中心的是离不开操作的人,要不时去优化、再定义它。”

鄢志杰表示,阿里云不是把市场上他人的处理方案集成到阿里云的零碎中,而是从麦克风的源头开端做技术。由于“只要这样,才干做到跟语音辨认零碎打通、完成结合优化;只要这样,才干确保辨认的精准度。”

“我们不需求从麦克风推销做起,我们做一切的推销零碎的集成。”

用户在运用产品的进程中,技术成绩会一个个冒出来。比方,被告面前的麦克风能收到原告从喇叭扩出来的声响。“我们就是专注于处理这样的成绩。” 鄢志杰说,大家在整个链条中各司其职,“这样,我们也更专注”。

“语音辨认真正要遍地开花的时分,需求特别高效的定制才能。” 鄢志杰表示,比方怎样在保证数据平安的状况下,进步带有口音的普通话、方言的精确辨认率?

除了语音辨认零碎,阿里云附带提供定制平台。在定制平台上,经过对方言语料的模型停止学习和运算,ET可以将方言的辨认精确率从40%-50%优化到80%-90%。这样,基层法院也可以享用到ET带来的便当。

在鄢志杰看来,明天很多人议论自然言语了解,很多时分是为搜索引擎时代的打字去做了解,而自然言语了解,尤其是口语了解的技术,十分重要。

“我们如今跟语音在一同,一定是包括了语音里的口语化景象。比方,语气词、进展、犹疑等。在这种状况下,是不是还能做到很好的了解?”

鄢志杰表示,本人的团队基于阿里云的根底设备,搭建起了整套的、云端的、超大规模的、语音的声学模型和言语模型的训练零碎。数十万小时的数据可以在十分快的工夫内完成模型的训练任务。并且,“根本上半年迭代一次次要的声学模型。”

“这些东西看起来是根底设备,但一旦到定制的时分,所展示出的效率、抢先的训练速度、定制化的才能是不容小视的。” 鄢志杰说,“算法+数据+计算的循环,就可以打造恣意一个垂直范畴、极高的语音辨认精确率的一个标杆。”

阿里云的云计算才能及其在技术上下的硬功夫,如算法优化,是智慧法庭一夜之间冒出来的根底的支撑点;协作同伴,如华宇,经过十几二十年的业务积聚,则拥有少量经过清洗的数据。

牵手华宇,阿里云将探究自然言语了解边界

北京华宇软件股份无限公司(简称“华宇”)是阿里云在司法范畴落地的一位很重要的协作同伴。

由于有了技术,还需求行业的协作同伴将其包装成终端的产品,再落实到细分行业中去。

华宇和阿里云在12月19日的云栖大会·北京峰会上签署了协作框架协议,正式树立协作同伴关系。据悉,单方将共同为客户提供基于阿里云计算平台的智慧法院、智慧检务、智慧司法等政法、司法范畴的使用效劳。

击败金牌速记员,阿里云ET当起了书记员和法官的“小助手”-天下网商-赋能网商,成就网商

阿里云与华宇签署协作框架协议

华宇创建于2001年,业务范围涵盖法院、检察院、司法行政、各级党委和政府部门以及各行业大型企事业单位。依据IDC中国电子政务研讨报告,华宇自2006年至今延续11年位列中国电子政务IT处理方案供给商10强。在法院、检察院信息化建立范畴,华宇延续多年市场占有率第一,客户普及全国。

此前,阿里云和华宇在法院庭审智能语音辨认范畴展开了深化协作。

2016年,华宇旗下的北京华宇元典信息效劳无限公司(简称“华宇元典”)成立,专注于为法律效劳范畴的从业者及相关机构等提供抢先的法律数据效劳及产品。

在华宇元典总经理邹绍坤看来,华宇元典有在法律行业的商业渠道和客户优势,有法律行业的专家和理解技术在法律范畴落地的技术研发团队,阿里云拥有抢先的人工智能技术、云计算才能。单方协作,可以组成一个三角式矩阵,为法律行业的客户提供效劳。

与阿里云深度协作,华宇将不只是技术集成,而是会对现有技术停止充沛发掘,将基于详细的法律场景提出更多技术上的要求。

邹绍坤以为,证据电子化是很多厂商都能做到的事情,关于法官而言,需求的是“证据逻辑的梳理、整理”。这不只需求图像辨认,更需求图像辨认技术对被文字压着的印章、手写签名等证据停止部分优化,在此根底上做证据无效性的剖析。

邹绍坤表示,法律行业自身是一个靠言语交流比拟多的行业,所以目前,语音辨认技术使用的更多。

鄢志杰表示,“明天,语音辨认在感知层面可以做到精度十分高;但是认知方面难度很高,如何在司法范畴发扬更大的价值?自然言语了解的技术边界在什么中央?这是我们下一步要去探究的。”

将来,单方也能够在图像辨认、人脸辨认、自然言语处置方面展开协作。