农企新闻网

阿里巴巴华先胜:AI+弱小算力给城市装上智能大脑

发布者:高龙
导读3月31日,由雷锋网(大众号:雷锋网)主办的AI盛会 ——「2018中国人工智能安防峰会」,在深圳科兴迷信园国际会议中心顺利召开。下午场中,阿里巴巴集团副总裁、达摩院机器智能实验室副主任华先胜博士在大会上宣布了主题为《城市大脑中的的大规模视觉智能》的演讲报告。华先胜作为视觉辨认和搜索范畴的国际级威望学者,取得过美国计算机协会ACM2015年度出色迷信家、MIT TR35大奖(全球35位35岁以下的

3月31日,由雷锋网 (大众号:雷锋网) 主办的AI盛会 ——「2018中国人工智能安防峰会」,在深圳科兴迷信园国际会议中心顺利召开。

下午场中,阿里巴巴集团副总裁、达摩院机器智能实验室副主任华先胜博士在大会上宣布了主题为《城市大脑中的的大规模视觉智能》的演讲报告。

华先胜作为视觉辨认和搜索范畴的国际级威望学者,取得过美国计算机协会ACM2015年度出色迷信家、MIT TR35大奖(全球35位35岁以下的出色青年创新人物)等荣誉,也曾担任ACM Multimedia大会的顺序委员会主席。现任阿里巴巴集团副总裁,达摩院机器智能实验室副主任。

华先胜在演讲中引见到,阿里巴巴在两年前就曾经有两个团队开端探究完成城市智能大脑。以后AI技术的开展、计算机算力的不时提升以及每天城市数据的超大规模会聚,都促使着城市智能大脑的飞速开展。

华先胜表示,城市智能大脑的中心就是应用不时开展的AI技术和逐渐增长的计算才能,来发掘城市中国少量异构数据不可替代的价值。 这种不可替代的价值表现在,经过剖析这些城市数据为城市的管理和效劳停止片面、实时的优化,从而让整个城市的管理和效劳愈加的便捷和灵敏,同时对城市的平安管理也有很大协助。他希冀城市大脑最终能成为一个城市像水煤电一样的根底设备。

以下是华先胜的演讲实录,雷锋网做了不改动原意的整理与编辑:


华先胜: 我之前讲城市大脑讲了很屡次,明天是第一次在安防的会议上讲,我想我从人工智能的角度来看安防成绩,或许能给大家带来新的考虑。另外一方面我明天要讲的内容也是我们团队经过两年的工夫和交警、公安一同摸爬滚打出来的技术点、使用场景和零碎,也希望能给大家带来一些启示。

“城市大脑”这个词是两年前提出来的,是怎样提出来的呢?它的背景其实就是AI技术的开展、算力的提升和数据超大规模的会聚。这些就使我们在想,可不可以为城市装置一个大脑,去发掘这个城市的价值,它的中心是,用不时停顿的AI技术和逐渐增长的弱小的计算才能,发掘城市外面少量异构数据不可替代的价值。

这个价值表现在什么方面?可以从不同的角度来讲,首先是数据智能助力城市管理和效劳,片面、实时的优化和干涉,这带来的必定是便捷和灵敏。往上一层就是城市管理范畴、效劳范畴和产业开展范畴的打破。再往上提一层是城市平安管理。

那么现今城市管理有哪些成绩呢?我总结有三点:

第一点是盲人摸象。 城市中有很多交通和安防感知设备是单点、部分的,且存在着设备损坏的景象,资源应用效率很低。

第二点是灯下黑。 目前城市中装置的摄像头大多并非智能摄像头,大批带智能剖析的设备功用单一、装置要求苛刻、本钱高;少量的摄像喽罗前应用率极低。

第三点是雾里看花。 已有的感知手难以发现景象面前的实质缘由• 视频是即时、直观的,未被无效应用。

为理解决这些成绩,我们希望聚合整个城市的各种数据,尤其是视频数据,开掘它们的价值。启动这项目时我们面临不少应战。这些应战也可以总结为三点:

一是投入 ,即处置城市发生的庞大数据所需求的的算力投入,带宽投入,算法研讨投入等。

二是价值 ,我们能从这些数据中发掘到哪些价值?这些价值是如虎添翼还是不可替代?

三是不同 ,即跟过来讲的智慧城市、视频监控有什么不一样?次要区别在哪里?

什么是城市大脑?

那么究竟什么是城市大脑呢?

首先是数据。城市每天发生少量的数据,有摄像视频、GPS、公交、微波等等,这些数据都会被运用,其中潜在价值最大的数据是视频数据,但这也是最难用的数据。

其次是感知,或许叫认知,即了解视觉里看到的事情,物体,做到了如指掌。之后是停止决策优化,比方差遣交警处置监测到的交通事故,感知全城的车、人流并停止全局优化。

另外就是搜索发掘,我们可以将全城的视觉元素发到一个搜索引擎外面,然后在索引外面搜索全城摄像头看到的视觉元素。

再者是预测,我们可以依据历史数据对交通或平安停止更为临时的预测。然后依据预测出来的交通,平安情况来对城市停止干涉,缓解城市拥堵,事前为市民提供更好的出行建议等。

这是整个城市级别的全局智能,我们把这样一套零碎叫做城市大脑。 目前以交通和平安为重要使用场景,之后会拓展至环保、动力、土地等范畴。限于工夫,我上面只针对以上感知、搜索和预测这三方面展开来讲一讲。

感知

城市大脑的根底层是感知层。城市感知层的开展阅历了很多阶段。最早是无感无知,那时分想晓得发作了什么需求到现场去理解;后来是感而不知,很多摄像头和录像带,但都需求人来监控;再后来是感而略知,摄像头有了一点点智能。而我们明天要做的城市大脑则是要做到感而 片面 知,感而 全量 知,感而 实时 知。

1)片面

所谓片面,就是要对摄像头看到的东西能片面地感知,可以检测辨认挪动的或许运动的目的(例如车、行人等),剖析出目的属性(车牌、车型、性别、服饰等),同时还要求快、准、大小目的都能检测,且对视频质量、光照、天气、夜晚等具有较高的鲁棒性。

为到达这个目的,我们做了一个 高效全尺寸多目的检测的算法 ,在车辆检测和行人检测方面效果极佳。基于这个后果,我们博得了两项竞赛的第一名,第一个是车辆检测,在榜单第一名继续了一年工夫。第二个是行人检测,继续了几个月第一名。 

除了感知人、车、物以外,还必需要感知事情。平常车流都是正常通行,这样的数据是少量的,而异常数据普通是稀少的。所以首先我们为正常事情建模;当异常事情呈现时,它就会有分明的呼应。基于 时空异常的检测 ,我们可以检测到车与人相撞、车与车相撞、车与路相撞,人与人相撞等等。

2)全量&全时

方才讲了两个事情,一个是物,一个是事。这外面有一个很大的事情,我们号称要在云端处置,究竟能不能算得过去?在云端的计算才能有多强?这触及到全量和实时这两个目标。

背靠阿里云,我们树立大规模实时处置平台并没有那么困难,但由于处置的数据量十分大,计算也并不是一件容易的事。并且还要思索运用少量机器所带来的本钱成绩,所以我们不断在进步零碎的功能。目前我们用了2000台,功能曾经比第一版提升了20倍,并无望在参加新硬件后持续提升好几倍。

关于城市大脑,我详细举个例子,也是我们行将发布的一个产品,叫做机器替代交警巡查。以后城市中存在着少量没有智能的球机,我们明天的任务就是让城市中少量的球机变得有智能,不论是交通守法还是交通事故,都可以让它停止监控。这是一个实时监控到的路况视频。在几秒中内我们就检测到这个中央发作了交通事故,用的工夫和交警差不多。其实还有很多,例如行人闯禁、拥堵、摩托车闯禁、夜间事故等,及时目的十分小,我们仍然可以检测出来。如今杭州有200多个试点球机,每天会有好几千起事情被发现,这远远超越了交警的才能。

这个任务有一个特点,就是充沛应用城市既有的监控设备发扬它最大的效率,不需求再装置一个摄像机;不论你的视频的质量怎样样,我们都可以处理成绩。

这是在杭州城市大脑的理论,我们在不添加外场设备、不改动现有链路的状况下,经过视觉云上的计算,使得设备的才能失掉很大的提升,我们如今也在做AI芯片的线上测试,会进一步增加计算的耗费,可以提升到很高的处置才能。

搜索和发掘

再往后就是「搜索和发掘」,这是实时停止处置的。

我们在互联网上找东西可以经过搜索引擎来找;假如我们把城市里看到的人、车、路、物、事等等全部放到搜索引擎里去,那么城市的管理者要找城市发作的事情,就可以直接经过城市的搜索引擎来找了。

做这件事情有两大应战。

  • 第一个应战是零碎的应战,也就是说你要去索引那么少量的数据,怎样才干够让索引的搜索足够快。这局部是阿里擅长的,我就不再细讲。

  • 第二个应战是用什么东西去描绘我们关怀的这些对象。当然我们可以用构造化的信息来做,例如车是什么颜色、什么牌子,人是男是女等等。但我们这里用的是特征的方式来表示,它是一串数字,这串数字就替代了你所关怀的车和人的特征,我们经过这个特征停止目的的索引和检索。怎样样找到适宜的特征呢?怎样样把一个图片、一个目的变成一个特征呢?这是中心的课题。现实上可以有很多办法,例如经过学习办法、神经网络办法、目的函数设计等。

这里我只引见我们前不久的一个任务,就是Part-Level特征学习。经过这个学习,在索引和比拟时,学习到的特征就会成为重要的目标。经过这种办法也可以发现一些共同的中央,例如我们做商品车检索时比拟复杂,同一牌子和型号就可以认定是同一产品了;但是在安防的场景下,不同人的车是不同的东西,这时分需求发现它的粗大的差异,而且要自动开掘它。我们这些任务使用外行人Re-Id测试中,目前后果是最好的,到达了97%,而人类的最好后果是94%。

预测

接上去讲「预测」。虽然我们无法预测某个集体的行为,但是我们可以预测全体的趋向。

我们在苏州做了这样一个实验,预测车流在20分钟、30分钟后的变化。我们平常常常运用的GPS导航,现实上它仅仅是依据以后车流给你选择的一条最优道路,而并没有车流预测;由于交通情况不断在变化,所以能够走着走着它就会给你建议不同的道路。显然假如有了预测,GPS的途径规划就可以做得更好了;假如预测工夫更长的话,甚至还可以停止更好的干涉。我们用深度学习的办法在苏州做过一个预测车流10分钟后变化的实验,预测后果很好,错误率在8%以内。

城市大脑的不同之处

在最初,我复杂讲一下城市大脑与其他概念的不同之处。这次要也有三点:

  • 第一,用少量异构城市数据、大规模计算和AI,发掘其不可替代的价值;

  • 第二,城市大脑是在做人的智能不能完成的事情。城市中有些成绩的复杂度、计算量曾经没有方法用人力来完成,比方说红绿灯的配置、众多球机的观测等,因而我们要经过城市大脑完成人不能完成的事情;

  • 第三,希望城市大脑未来能成为一个城市的根底设备,像水电煤一样。

深度学习、数据、计算才能使得AI有了开展,这个开展使得我们去考虑能不能为城市建造一个大脑,发掘城市的价值,改动这个城市,改动我们在城市里的生活方式。由于城市的环境是十分共同的,它的数据量、计算需求,成绩复杂性以及它对价值发掘需求的量和迫切性使得城市可以成为一个平台,或许说城市大脑可以成为一个平台,去孵化更多的技术,在这个平台上有更多的创新可以开掘出来,使得一些科研的技术、实验室的技术在这个平台上失掉锻炼,失掉扎扎实实的完成。这也是为什么「城市大脑」会被科技部选为首批四个国度人工智能开放创新平台之一。

via 雷锋网AI科技评论

阿里巴巴华先胜:AI+强大算力给城市装上智能大脑