农企新闻网

云从周翔:三年打磨,云从如何成为计算机视觉国度队

发布者:金阳东
导读2018 年 2 月,云从科技正式在国际发布「3D 构造光人脸辨认技术」,这是中国企业初次将构造光技术使用在人脸辨认零碎上,相较以往的 2D 人脸辨认及以红外活体检测技术,在准确度、呼应速度等方面获得反动性打破。近日,云从科技又在跨镜追踪技术(Person Re-Identification,ReID)上获得严重停顿,他们同时在 Market-1501,CUHK03,DukeMTMC-reID 三

2018 年 2 月,云从科技正式在国际发布「3D 构造光人脸辨认技术」,这是中国企业初次将构造光技术使用在人脸辨认零碎上,相较以往的 2D 人脸辨认及以红外活体检测技术,在准确度、呼应速度等方面获得反动性打破。

近日,云从科技又在跨镜追踪技术(Person Re-Identification,ReID)上获得严重停顿,他们同时在 Market-1501,CUHK03,DukeMTMC-reID 三个数据集上刷新世界记载。ReID 是应用计算机视觉技术判别图像或许视频序列中能否存在特定行人,无需人脸,依据穿着、体态、发型就能识人。

云从周翔:三年打磨,云从如何成为计算机视觉国家队

图:ReID 行人辨认技术

云从科技近期在 AI 科技评论推出的数据库项目 「AI 影响因子」 上表现活泼,针对他们的这两大打破,雷锋网 (大众号:雷锋网) AI 研习社对云从科技研讨院副院长周翔停止了一次专访,理解到云从研讨院的任务、云从技术上的创新及目前的研讨重点。

早在云从科技成立之前,周翔就在重庆中科院跟随周曦博士(云从开创人)从事人脸辨认研讨。后来,周曦博士从中科院辞职成立云从,周翔也作为初创员工参加。

周翔目前担任云从科技研讨院副院长,次要担任三个方向:数据的搜集与处置、技术研讨、POC 测试。

以下为采访原文,雷锋网 AI 研习社做了不改动原意的编辑整理。

云从研讨院

问:云从科技研讨院在公司里处于什么样的战略位置?目前研讨院次要停止的任务有哪些?

周翔:云从一切中心技术都来自云从研讨院,目前,研讨院处于云从战略最高点。研讨院的任务围绕三个方向展开:

  • 一是对前沿算法的深化研讨、自主创新。我们会紧跟以后世界上最前沿的计算机视觉技术和人工智能技术,也会新陈代谢,研讨新的人工智能视觉算法。

  • 二是针对业内已有的算法停止深化研讨。比方我们刚刚发布的「3D 构造光人脸辨认技术」,跨镜追踪技术(ReID)。此外,还有车辆、人群密度、交通行为、拥堵、医疗影像等等,只需与计算机视觉有关,我们都会或多或少停止规划。

  • 三是将算法产品化。我们需求对这些算法停止封装,做产品级别的 SDK 和引擎。

问:云从与中科院、上海交大共建两个结合实验室,这两个结合实验室目前次要停止哪些方面的研讨?

周翔: 这两个结合实验室侧重于计算机视觉范畴的前沿算法研讨。云从会将前沿范畴的研讨放到高校团队,让先生与研讨人员一同,做一些预研以及算法的根底研讨。

此外,云从开创人周曦是这两所高校的博士生导师,他也会对先生停止论文指点,引荐他们参与顶会。

问:云从科技于 2015 年成立,这 3 年来,你们在计算机视觉范畴获得了哪些具有代表性的技术打破?

周翔:云从成立之前,我们在中科院的技术就曾经比拟抢先。2015 年,我们在 FDDB(Face Detection Data Set and Benchmark) 和 LFW(Labeled Faces in the Wild Home) 上刷到前三之后,觉得曾经很好地展现了学术实力,就开端专心打磨产品。公司成立初期,我们更多看重产品落地。

当然,我们也不断在做前沿研讨,往年二月,我们发布构造光 3D 人脸辨认技术,最近,我们在 ReID(跨境追踪技术)上又一次刷榜。

随着公司的开展,队伍越来越壮大,我们能够会有新的定位,也会去宣布论文,宣传技术上的打破。当然,我们还需求静下心来,踏踏实实将技术落地,只要这样,客户才会认可我们。

问:接上去云从研讨院次要会攻克哪些方面的难题?

周翔:首先做好计算机视觉范畴的根底技术研讨,比方对人脸、车辆、行人的检测。

之后,我们会投入更多工夫,去从人的角度剖析构建深度神经网络,让深度学习具有可解释性。对深度学习有所理解的人都晓得,它是一个「黑匣子」,虽然很多时分远胜传统算法,但缺乏可解释性。我们研讨人工智能,应该要让计算机可以像人类一样去考虑和辨认,具有本人的逻辑判别,并且我们人类可以了解他们的考虑。

问:你们近日在 Market-1501 上的首位命中率(Rank-1 Accuracy)到达 96.6%,刷新 ReID 榜单,这一数字能否还存在很大提升空间?与人脸辨认相比呢?

周翔:提升空间一定存在,但是对行人辨认的研讨比人脸辨认更难。

  • 第一,人脸的五官、脸型比拟固定,不能够发作特别大的变化。行人不一样,大家在走路、打球、跑步时的姿势千变万化,随同弯腰、后仰等各种举措,没方法很好地约束。

  • 第二,我们还要依据体态、穿着来判别行人。假如很多人穿着异样的衣服,辨认难度将更大。我们次要的判别根据就是服饰、配饰、体型、发型等特点。假如两团体的服饰、发型等相似,这将很难辨识。

问:为了加深行人辨识的精准度,次要用到的中心技术有哪些?

周翔:外行人辨认上,我们创新性地提出全局+部分多粒度的辨认实际。我们能经过人的形状、服装等去做全体判别,然后再经过一些细节,比方衣物商标、挎包类型、服饰特征去判别,即聚合同一团体在不同状况下的照片。

云从大脑

问:你们曾提到训练人脸辨认时的网络架构,包括构造化+非构造化的数据、双层异构深度神经网络、三层金字塔式的迁移学习,这与云从大脑有什么关联?

周翔:这是云从大脑其中一个最根底的辨认认知模型。

问:在云从大脑构建的进程中,次要的技术难点有哪些?

周翔:最后构建云从大脑时,还是存在一定难度。开源算法有很多,但我们需求研制出支持大类别散布式训练的算法。

人的类别是无量的,以中国人来举例,就有十几亿的类别,这需求少量数据停止训练。在算力一定的状况下,如何让效率更高;假如模型太深,如何去做减速,这些难点需求一个个打破。

问:目前不断在停止云从大脑的优化与改良吗?

周翔:是的,目前云从大脑只要人脸辨认功用,后续我们会参加行人辨认,之后会渐渐扩大,参加车辆、人群等,让它的使用的范畴愈加普遍。最初,我们还思索将语音、文字等的辨认全部构建到云从大脑上,让这个大脑就像人脑一样,既能看懂图像,还得读懂文字,还能听到声响,了解语意。这是我们的最终目的。

问:想要把行人辨认等其他功用交融进云从大脑,需求处理哪些技术上的难点?

周翔:次要有以下几点:

  • 第一,将一切算法交融到一同,变成一个超级大脑停止一致剖析,输入无效信息。

我们常提到谷歌的 AlphaGo,它只会下围棋,异样,我们的网络有些剖析人脸,有些剖析行人,有些剖析车辆,如何将算法以及剖析后果交融,变成一个全体,这是一个应战。

  • 第二,海量的数据。

当数据越来越多,如何对这些海量数据停止无效剖析;哪些数据是无用数据,如何高效去除这些无用数据。

  • 第三,算力。

如何经过硬件的异构处置,充沛进步算力和速度,降低能耗。

问:中科院李子青教授此前在雷锋网安防峰会上提到,他们针对安防数据运用半监视自主学习,这是一个技术亮点,效果好过监视学习很多倍。你们在训练 AI 的时分,运用的是迁移学习。比照起来,半监视自主学习和迁移学习在大规模人脸辨认的场景下,差别点在哪里?

周翔:迁移学习是在一定的数据根底上去做知识的迁移,我们在最底层也用到监视学习,此外,或多或少会用一些半监视或非监视的学习办法。李子青教授团队能够在半监视学习算法里做了更多的改良,把它变成一个亮点,使这一算法的效率更高,效果更好。

其实每家公司在许多环节中或多或少都会有一些创新,大家的算法都会有各自的特点,用哪种算法并不是那么重要。

另外,办法的运用也与数据有关。后面提到我们有超大规模构造化数据,应用这种数据,我们能很好地训练底层人脸辨认模型。假定如今我们没有这种数据,只要互联网上的或是经过其它项目失掉的非构造化数据,那就没方法很好地用监视学习,只能应用半监视或非监视学习的办法了。

走向行业

问:云从刚开端成立的时分,先在金融范畴占据少量市场,后来又规划安防范畴。在将产品使用于这两个行业的时分,对技术的要求会存在哪些差别?

周翔:差别十分大。

金融行业更看重的是平安,算法必需到达极致。银行对人脸辨认算法的误识率要求十分高,比方说百万分之一的误识率,直观解释,即 100 万团体拿着他人的身份证去取钱,只要一团体可以骗过算法。

此外,银行场景下获取到的人脸图片质量要比安防行业好。

但公安就不一样了,他们对人脸辨认精确率的要求没有银行高,更看重的是算法的综合运用,即平台才能、零碎才能。

公安会看注重频处置的速度,需求能实时显示。举个复杂的例子,比方嫌疑犯从某一地点经过,零碎需求 30 秒才干将他辨认出来,那就不行,公安会说,再不快一点确认,嫌疑犯就跑了。

另外,只要人脸辨认行不通,公安更看重的是能不能跟行人辨认相结合,辨认出来之后,能不能去做联动,假如在其它视频里也发现这团体,能否能画出他的举动轨迹,把他的呈现地点、频次等信息都反应出来。

问:您后面也提到云从的技术很早就曾经很成熟,后来次要是在做落地。你们在将算法落地的进程中,面临哪些比拟大的应战?

周翔:要将算法落地做成一款产品,需求思索的要素十分多,也面临着很多应战。算法好不代表产品好,产品好也不代表客户一定会用。

直观一点解释,做成产品,要思索外观、运用体验、零碎的流利性、售后,即如何把产品包装成客户认可的处理方案。

我们是 2B 公司,客户的需求千变万化,如何疾速定制、疾速处理客户的不同需求,这都是需求思索的。

另外,将产品推向市场时,还需求思索公司能否具有资质,能否避开了其它公司的专利,能否有商务上的成功案例。

问:很多人都会将云从、依图、旷视、商汤这 4 家以 CV 为中心的公司来比拟,您如何对待这三家友商?

周翔:这几家公司在算法层面做的都还不错,我也十分欣赏这几家公司。虽然我们各家也会在一些范畴上停止 PK,但每家公司的算法特点会有一定区别。

商汤招募了十分多的博士在内的研讨人员,研讨范畴触及多个方面,比方自动驾驶、商超等范畴,他们想赋能百业,把人工智能使用到各个行业。

旷视最近刚刚收买艾瑞思机器人(Ares robot),它们能够更多地想在机器人范畴停止扩展。他们在互联网金融上做得十分出色,在这里比拟有优势。

依图最早是做车辆辨认以及安防,他们的安防算法做得很棒,失掉公安的高度认可。目前他们也在做医疗,我们也希望他们在医疗上能做出十分好的成果。

云从跟这几家公司也有一些区别,云从是国度产业队,我们拿了一些国度级别的项目,更侧重顶层设计。

我们目前接触最多的是银行、公安,我们会从四大行开端浸透,先把金融做得更好,然后在金融范畴做一些其它的 AI 业务,包括风控、智慧银行等。

关于安防,我们会跟公安部协作,先去设计一些规范,然后做出一些公安高度认可的产品和零碎。

相关文章:

96.6% 云从科技跨镜追踪(ReID)技术刷新三项世界纪录

国产再打破 云从科技首发3D构造光人脸辨认技术

云从周翔:三年打磨,云从如何成为计算机视觉国家队