农企新闻网

如何用未标注样本处理单标注样本下的视频行人重辨认成绩?

发布者:马楠
导读雷锋网(大众号:雷锋网)AI 科技评论按:本文作者为悉尼科技大学博士生武宇(Yu Wu),他依据 CVPR 2018 录用论文 Exploit the Unknown Gradually: One-Shot Video-Based Person Re-Identification by Stepwise Learning 为 AI 科技评论撰写了独家解读稿件。在这篇论文中,我们提出了经过逐步应用未

雷锋网 (大众号:雷锋网) AI 科技评论按:本文作者为悉尼科技大学博士生武宇(Yu Wu),他依据 CVPR 2018 录用论文 Exploit the Unknown Gradually: One-Shot Video-based Person Re-Identification by Stepwise Learning 为 AI 科技评论撰写了独家解读稿件。

在这篇论文中,我们提出了经过逐步应用未标注样本,来处理单标注样本(one-shot)状况下的视频行人重辨认成绩(video-based person re-ID)。这个办法很复杂通用,在两个大型的视频行人重辨认数据集上都到达了远超 state-of-the art 的功能。

1. 为什么需求单标注样本成绩?

目前大多行人重辨认办法都依赖于完全的数据标注,即需求对每个训练集里的人在不同摄像头下的数据停止标注。但是关于实践的监控场景,如一个城市的监控视频来说,从多个摄像头行家工标注每段视频的行人标签的代价很大。因而我们尝试去只用单标注样本,让网络本人去学会应用那些未标注的样本。也就是说关于每个行人,我们只需求标注其中一段视频,其他的视频经过算法本人去探究。

关于这个义务,典型的做法是为未标注数据估量一个标签,然后用初始的标注数据和局部选定的带有假定标签 (pseudo-label) 的数据用来训练模型。

但是由于只用初始标注数据训练出来的模型功能太弱,可信的 pseudo-labeled 数据是很少的,这样选择数据注定会引入很多错误的训练样本。所以我们提出了 EUG(Exploit the Unknown Gradually)办法,迭代地去预测标签和更新模型,这样一步步天时用未标注数据。

另外,我们发现直接用分类器预测出来的标签是不牢靠的,我们提出经过特征空间外面的最近邻 (Nearest neighbor) 分类方式,去给每个未标注数据分配 pseudo label。

2. 如何去应用未标注样本

如何用未标注样本解决单标注样本下的视频行人重识别问题?

如图,我们一开端用有标注的数据来初始化训练 CNN 模型,之后在每一次循环中我们(1)挑选可信的 pseudo-labeled 数据 2. 用标注数据和 pseudo-labeled 数据一同来更新 CNN 模型。我们经过逐渐增大每次参加训练的 pseudo-labeled 数据量,从而逐步去应用更难辨认的,包括更多信息多样性的视频片段。

这里有两个值得留意的点:

(1)如何决议每次选取多少 pseudo-labeled 数据做训练

我们用一种静态测量,逐步添加选取的样本。在开端的循环中,只要一小局部 pseudo-labeled 数据被选中,之后会有越来越多样本被加出去。我们发现添加样本容量的速度越慢,即每一步迭代比上一步添加的 pseudo-labeled 样本越少(对应需求的迭代次数更多),模型的功能越高。pseudo-labeled 样本量的增长速度对模型最终功能的影响非常明显。

(2)如何去给一个未标注数据分配 pseudo label 并量化其可信水平?

跟之前大局部 re-ID 的办法一样,我们的训练时采用的也是一个行人分类网络,因而关于未标注样本,网络分类的预测值(Classification score)是可以用来预测标签并判别标签相信度的。但是这样的分类层在样本量很少,特别是我们这种每个类只要一个样本的状况下的状况下是不太牢靠的。

同时我们留意到行人重辨认(re-ID)的测试进程是一个计算特征之间间隔并停止检索的进程,所以我们从这个角度动身,也去计算未标注数据与标注数据之间的间隔(Dissimilarity cost criterion)。关于每个未标注的样本,我们把离它最近的有标注样本的类别赋予它作为 pseudo label,并且将他们之间的间隔作为标签估量的相信度,如下图所示。

如何用未标注样本解决单标注样本下的视频行人重识别问题?

我们发现,这种用间隔度量的方式选出来的 pseudo-labeled 数据要比分类层的预测要牢靠很多。

3. 算法实践选出来的样本如何?

我们的办法在 MARS 和 DukeMTMC-VideoReID 这两个大规模的视频行人重辨认数据集上都获得了极大的进步。上面我们展现一下算法选出来的 pseudo-l对于互联网金融P2P企业来说,支付市场完善的标准和管理系统将彻底改变互联网金融行业的格局,不仅给从业者提供了的巨大的发展机遇,也带来了全新的挑战。abeled 样本。

如何用未标注样本解决单标注样本下的视频行人重识别问题?

这是一个算法运转时为右边这个行人选出来的 pseudo-labeled 样本,可以看到在第 0 次迭代时前往的样本都是和初始化视频很类似的正确数据。算法在第 1 次和第 2 次迭代时分开端前往了不同视角的正确数据,在第 5 到 7 次迭代时分前往了更难以分辨的正确样本(完全不同的视角、遮挡和严重摄像头色差)以及局部错误样本。没有被找到的这个视频片段简直是全黑的。

Pytorch 代码完成参见:

https://github.com/Yu-Wu/Exploit-Unknown-Gradually

DukeMTMC-VideoReID 数据集引见和 baseline 代码:

https://github.com/Yu-Wu/DukeMTMC-VideoReID

如何用未标注样本解决单标注样本下的视频行人重识别问题?