农企新闻网

CVPR 18 论文解读:基于空泛卷积神经网络的高密度人群了解办法

发布者:陈书一
导读雷锋网(大众号:雷锋网)AI 科技评论按:本文作者为美国伊利诺伊大学(UIUC)张晓帆,他为 AI 科技评论撰写了基于 CVPR 录用论文《CSRNet: Dilated Convolutional Neural Networks for Understanding the Highly Congested Scenes》的独家解读稿件,未经答应不得转载。论文地址:https://arxiv.or

雷锋网 (大众号:雷锋网) AI 科技评论按:本文作者为美国伊利诺伊大学(UIUC)张晓帆,他为 AI 科技评论撰写了基于 CVPR 录用论文《CSRNet: Dilated Convolutional Neural Networks for Understanding the Highly Congested Scenes》的独家解读稿件,未经答应不得转载。

论文地址: https://arxiv.org/pdf/1802.10062.pdf

来自北京邮电大学和美国伊利诺伊大学(UIUC)的研讨者们提出一种适用于密集人群计数的空泛卷积神经网络模型 CSRNet。该网络模型摆脱以往普遍使用于人群计数的多通道卷积网络方案,在大幅增添网络参数量和网络训练难度的同时,明显提升了人群计数的精度和人群散布密度图的复原度。该研讨已被 CVPR 2018 接纳。

人群计数和人群密度估量有着重要的安防使用场景。随着城市人口的日益增长,在地铁站,商场,各种节日集会中,超额聚集的人群带来潜在风险,极容易形成踩踏、骚乱等喜剧。因而,人群计数和人群的密度散布估量成为安防范畴的抢手课题。近年来,人群计数的算法功能在与深度学习的结合下失掉了很大的提升。

人群计数的目的是找出特定场景中的人数,而人群密度散布估量需求获取空间密度信息和人数(密度图求和)。人群计数的难点在于,场景的变化跨度大,目的的尺度变化不尽相反,人和人、人和景物之间存在不同水平的遮挡等等。如图 1 所示,三张图均包括了 95 人,但是他们的空间散布完全不同。

CVPR 18 论文解读:基于空洞卷积神经网络的高密度人群理解方法

图 1 人群计数场景

作者研讨发现,被普遍运用在人群计数上的多通道卷积网络(MCNN)存在着构造冗余、参数单一、训练困难的局限性。此类多通道卷积网络在不同通道上采取大小不等感受域的卷积网络,以顺应不同场景(如高、中、低密集水平)的人群计数需求。但研讨发现,不同通道学习到的特征重合度很高(图 2),并没有因场景密集水平不同而呈现分明差别。多通道网络表现冗余。为作比照,作者采用一个参数更少、更深层、更易训练的单通道卷积网络(A deeper CNN),取得比多通道网络更好的效果(表 1)。

CVPR 18 论文解读:基于空洞卷积神经网络的高密度人群理解方法  

图 2 多通道卷积网络中的大、中、小通道在 ShanghaiTech PartA 中的测试表现类似

CVPR 18 论文解读:基于空洞卷积神经网络的高密度人群理解方法  表 1 更深的单通道卷积网络运用较少参数却在 ShanghaiTech PartA 中取得更小误差

此外,作者为了防止过度运用降采样而招致密度图的分辨率损失,在网络的后半局部引入了空泛卷积层,应用空泛卷积增大感受域并维持分辨率(图 3),并提出 CSRNet 网络模型(表 2)。CSRNet 后端四组不同的配置在 ShanghaiTech PartA 中功能测试如表 3。

CVPR 18 论文解读:基于空洞卷积神经网络的高密度人群理解方法

图 3 运用卷积+池化+上采样(上)与空泛卷积(下)输入异样分辨率图像,空泛卷积可保存更多图像细节

CVPR 18 论文解读:基于空洞卷积神经网络的高密度人群理解方法  表 2 CSRNet 网络构造,卷积以参数命名为(conv kernel size – channel – dilation rate)

CVPR 18 论文解读:基于空洞卷积神经网络的高密度人群理解方法

 表 3 CSRNet 的四种后端配置在人群计数中精度比照,其中方案 B 精度最高

由于采用比多通道网络更复杂的构造,CSRNet 在训练时可直接采用端到端训练并疾速复理想验后果,也可应用迁移学习进步训练效果。得益于复杂、规整的网络构造,CSRNet 对硬件完成愈加敌对,可以高效地部署在物联网设备中。

实验标明,CSRNet 在四个地下人群数据集(Shang聚焦消费升级、多维视频、家庭场景、数字营销、新零售等创新领域,为用户提供更多元、更前沿、更贴心的产品,满足用户日益多样化、个性化的需求。haiTech dataset、the UCF CC 50 dataset、the WorldEXPO'10 dataset、the UCSD dataset)和一个车辆数据集(TRANCOS dataset)上均到达了最高程度的准确度(State-of-the-art Performance),详见表 4 至表 8。

CVPR 18 论文解读:基于空洞卷积神经网络的高密度人群理解方法

表 4 ShanghaiTech 数据集测试后果

CVPR 18 论文解读:基于空洞卷积神经网络的高密度人群理解方法   表 5 UCF CC 50 数据集测试后果

CVPR 18 论文解读:基于空洞卷积神经网络的高密度人群理解方法   表 6 WorldExpo' 10 数据集测试后果

CVPR 18 论文解读:基于空洞卷积神经网络的高密度人群理解方法

表 7 UCSD 数据集测试后果

CVPR 18 论文解读:基于空洞卷积神经网络的高密度人群理解方法

表 8 TRANCOS 数据集测试后果

CVPR 18 论文解读:基于空洞卷积神经网络的高密度人群理解方法