谷歌发布 Open Images V4数据集，190万张图片开启地下图像应战赛

2025-09-07 07:49:20

导读雷锋网 AI 科技评论音讯：4 月 30 日，谷歌在其官方博客上发文称将开放 Images V4 数据库，并同时开启 ECCV 2018 地下图像应战赛。雷锋网编译全文如下：2016 年，我们发布了一个包括大约 900 万张图片、标注了数千个对象类别标签的数据集 Open Images。发布之后，我们不断在努力更新和改良数据集，以便为计算机视觉社区提供有用的资源来开发新模型。明天，我们很快乐地宣布

雷锋网 AI 科技评论音讯：4 月 30 日，谷歌在其官方博客上发文称将开放 Images V4 数据库，并同时开启 ECCV 2018 地下图像应战赛。雷锋网编译全文如下：

2016 年，我们发布了一个包括大约 900 万张图片、标注了数千个对象类别标签的数据集 Open Images。发布之后，我们不断在努力更新和改良数据集，以便为计算机视觉社区提供有用的资源来开发新模型。

明天，我们很快乐地宣布开放 Open Images V4 ，它包括在 190 万张图片上针对 600 个类别的 1540 万个边框盒， 这也是现有最大的具有对象地位正文的数据集 。这些边框盒大局部都是由专业正文人员手动绘制的，确保了它们的精确性和分歧性。另外，这些图像是十分多样化的，并且通常包括有多个对象的复杂场景（均匀每个图像 8 个）。

谷歌发布 Open Images V4数据集，190万张图片开启公开图像挑战赛

与此同时，我们还将宣布启动 Open Images 应战赛，这将是在 2018 计算机视觉欧洲会议（ ECCV 2018 ）上举行的一场新的对象检测应战赛。Open Images 应战赛将遵照 PASCAL VOC 、 ImageNet 和 COCO 等赛事的传统， 但是其规模将是绝后的。

Open Images 应战赛在一下这几个方面将是无独有偶的：

有 170 万张训练图片，其中有 500 个类别和 1220 万个边框正文；
与以前的检测应战相比，将有更普遍的类别，包括诸如「fedora」、「snowman」等这样的新对象；
除了主流的物体检测外，本次应战赛中在检测物体对时还将包括视觉关系检测，例如「woman playing guitar」。

训练数据集如今曾经可以运用；一个包括有 10 万张图片的测试集将于 2018 年 7 月 1 日发布在 Kaggle 上。应战赛提交后果的截止日期为 2018 年 9 月 1 日。

我们希望更大的训练集可以安慰对更复杂检测模型的研讨，这些模型将超越以后 state-of-the-art 的功能；而从另一方面，我们希望 500 个类别可以更准确地评价不同探测器在哪些方面表现的更好。此外，拥有少量带有多个对象标注的图像，可以帮组你探究视觉关系检测，这还是一个抢手的新兴话题，而且具有越来越多的子社区。

本次涌现的 AI、区块链和物联网热潮不同于以往，将对产业、社会和生活产生真正堪称“颠覆性”的变革。IT 技术人员需要全方位地“换脑”：对原有的知识结构进行全面刷新，全面升级。

除了上述内容外，Open Images V4 还包括了 3010 万张经过人工验证的针对 19794 个类别图像级标签的图片。当然这些标签不属于应战赛的一局部，其中的 550 万张图像级标签是由来自世界各地不计其数名用户经过 crowdsource.google.com 生成的。

via Google Blog，雷锋网 (大众号：雷锋网) AI 科技评论编译

。

免责声明：本文章由会员“高夕一”发布如果文章侵权，请联系我们处理，本站仅提供信息存储空间服务如因作品内容、版权和其他问题请于本站联系

标签：