CVPR 18 论文解读：基于空泛卷积神经网络的高密度人群了解办法

2025-08-04 21:41:46

导读雷锋网(大众号：雷锋网)AI 科技评论按：本文作者为美国伊利诺伊大学（UIUC）张晓帆，他为 AI 科技评论撰写了基于 CVPR 录用论文《CSRNet: Dilated Convolutional Neural Networks for Understanding the Highly Congested Scenes》的独家解读稿件，未经答应不得转载。论文地址：https://arxiv.or

雷锋网 (大众号：雷锋网) AI 科技评论按：本文作者为美国伊利诺伊大学（UIUC）张晓帆，他为 AI 科技评论撰写了基于 CVPR 录用论文《CSRNet: Dilated Convolutional Neural Networks for Understanding the Highly Congested Scenes》的独家解读稿件，未经答应不得转载。

论文地址： https://arxiv.org/pdf/1802.10062.pdf

来自北京邮电大学和美国伊利诺伊大学（UIUC）的研讨者们提出一种适用于密集人群计数的空泛卷积神经网络模型 CSRNet。该网络模型摆脱以往普遍使用于人群计数的多通道卷积网络方案，在大幅增添网络参数量和网络训练难度的同时，明显提升了人群计数的精度和人群散布密度图的复原度。该研讨已被 CVPR 2018 接纳。

人群计数和人群密度估量有着重要的安防使用场景。随着城市人口的日益增长，在地铁站，商场，各种节日集会中，超额聚集的人群带来潜在风险，极容易形成踩踏、骚乱等喜剧。因而，人群计数和人群的密度散布估量成为安防范畴的抢手课题。近年来，人群计数的算法功能在与深度学习的结合下失掉了很大的提升。

人群计数的目的是找出特定场景中的人数，而人群密度散布估量需求获取空间密度信息和人数（密度图求和）。人群计数的难点在于，场景的变化跨度大，目的的尺度变化不尽相反，人和人、人和景物之间存在不同水平的遮挡等等。如图 1 所示，三张图均包括了 95 人，但是他们的空间散布完全不同。

CVPR 18 论文解读：基于空洞卷积神经网络的高密度人群理解方法

图 1 人群计数场景

作者研讨发现，被普遍运用在人群计数上的多通道卷积网络（MCNN）存在着构造冗余、参数单一、训练困难的局限性。此类多通道卷积网络在不同通道上采取大小不等感受域的卷积网络，以顺应不同场景（如高、中、低密集水平）的人群计数需求。但研讨发现，不同通道学习到的特征重合度很高（图 2），并没有因场景密集水平不同而呈现分明差别。多通道网络表现冗余。为作比照，作者采用一个参数更少、更深层、更易训练的单通道卷积网络（A deeper CNN），取得比多通道网络更好的效果（表 1）。

CVPR 18 论文解读：基于空洞卷积神经网络的高密度人群理解方法

图 2 多通道卷积网络中的大、中、小通道在 ShanghaiTech PartA 中的测试表现类似

CVPR 18 论文解读：基于空洞卷积神经网络的高密度人群理解方法表 1 更深的单通道卷积网络运用较少参数却在 ShanghaiTech PartA 中取得更小误差

此外，作者为了防止过度运用降采样而招致密度图的分辨率损失，在网络的后半局部引入了空泛卷积层，应用空泛卷积增大感受域并维持分辨率（图 3），并提出 CSRNet 网络模型（表 2）。CSRNet 后端四组不同的配置在 ShanghaiTech PartA 中功能测试如表 3。

CVPR 18 论文解读：基于空洞卷积神经网络的高密度人群理解方法

图 3 运用卷积+池化+上采样（上）与空泛卷积（下）输入异样分辨率图像，空泛卷积可保存更多图像细节

CVPR 18 论文解读：基于空洞卷积神经网络的高密度人群理解方法表 2 CSRNet 网络构造，卷积以参数命名为（conv kernel size – channel – dilation rate）

CVPR 18 论文解读：基于空洞卷积神经网络的高密度人群理解方法

表 3 CSRNet 的四种后端配置在人群计数中精度比照，其中方案 B 精度最高

由于采用比多通道网络更复杂的构造，CSRNet 在训练时可直接采用端到端训练并疾速复理想验后果，也可应用迁移学习进步训练效果。得益于复杂、规整的网络构造，CSRNet 对硬件完成愈加敌对，可以高效地部署在物联网设备中。

实验标明，CSRNet 在四个地下人群数据集（Shang聚焦消费升级、多维视频、家庭场景、数字营销、新零售等创新领域，为用户提供更多元、更前沿、更贴心的产品，满足用户日益多样化、个性化的需求。haiTech dataset、the UCF CC 50 dataset、the WorldEXPO'10 dataset、the UCSD dataset）和一个车辆数据集（TRANCOS dataset）上均到达了最高程度的准确度（State-of-the-art Performance），详见表 4 至表 8。

CVPR 18 论文解读：基于空洞卷积神经网络的高密度人群理解方法

表 4 ShanghaiTech 数据集测试后果

CVPR 18 论文解读：基于空洞卷积神经网络的高密度人群理解方法表 5 UCF CC 50 数据集测试后果

CVPR 18 论文解读：基于空洞卷积神经网络的高密度人群理解方法表 6 WorldExpo' 10 数据集测试后果

CVPR 18 论文解读：基于空洞卷积神经网络的高密度人群理解方法

表 7 UCSD 数据集测试后果

CVPR 18 论文解读：基于空洞卷积神经网络的高密度人群理解方法

表 8 TRANCOS 数据集测试后果

。

CVPR 18 论文解读：基于空洞卷积神经网络的高密度人群理解方法

免责声明：本文章由会员“陈书一”发布如果文章侵权，请联系我们处理，本站仅提供信息存储空间服务如因作品内容、版权和其他问题请于本站联系

标签：

上一篇：2018 淡季人才趋向报告：区块链人才需求暴跌10倍、均匀薪资2.58万元

下一篇：国外物联网项目融资大清点，工业物联网迎来大迸发