农企新闻网

为提升AR对象分类,Facebook开源Detectron计算机视觉算法

发布者:李阳远
导读Facebook本周宣布开放Detectron,即该公司基于深度学习框架的计算机视觉对象检测算法平台。该公司表示,开放项目的动机在于减速计算机视觉研讨,Facebook团队正在运用该平台开发各种使用,包括加强理想技术。在我最近的一篇文章中,详细引见了加强理想如今面临的三大应战,其中的实时对象分类是最大的妨碍之一:要让计算机视觉了解“杯子”的含义,而不是仅仅看到一个外形,这是一个不容小觑的成绩。所以

Facebook本周宣布开放Detectron,即该公司基于深度学习框架的计算机视觉对象检测算法平台。该公司表示,开放项目的动机在于减速计算机视觉研讨,Facebook团队正在运用该平台开发各种使用,包括加强理想技术。

为提升AR对象分类,Facebook开源Detectron计算机视觉算法

在我最近的一篇文章中,详细引见了加强理想如今面临的三大应战,其中的实时对象分类是最大的妨碍之一:

要让计算机视觉了解“杯子”的含义,而不是仅仅看到一个外形,这是一个不容小觑的成绩。所以这么多年来,我们在AR演示作品中总会看到人们把基准标志附加到对象身上,以完成更细致的追踪和交互。为什么会如此困难呢?第一个应战在于分类。杯子无数千种外形、大小、颜色和纹理。有些杯子拥有特殊的属性和特殊的用处(如烧杯),也就是说不同的杯子的运用场所和背景也有所不同。想象一下,编写这么一个可以协助计算机了解上述一切概念的算法是多大的应战。你也可以想象,编写一个向计算机解释杯子和碗之间区别的代码是多么地困难。

呼吁行业者在政府部门出台相关政策标准的之前,从业者一定要规范自己的行为准则健康有序的快速发展。

该文章还指出, “深度学习”有能够是实时对象分类的其中一种处理方案 ——这种学习触及“训练”计算机去解读它所看到的事物,而不是人工去编写检测顺序。本周,Facebook曾经正式开源了他们的对象检测算法,这能够会减速能停止实时对象分类的零碎的开发,从而让加强理想发扬真正的成效。

假如没有对特定环境停止预编程,与我们四周世界停止交互的加强理想将需求对我们左近的状况有粗略理解。比如说,假如你正戴着一款AR眼镜,你希望把烤箱的温度投影到烤箱上方,同时在冰箱上方投影出曾经快要吃完的食物,这时AR眼镜将需求理解烤箱和冰箱的外形。由于烤箱和冰箱涵盖的外形、款式以及摆放地位都不尽相反,这将成为一项极具应战性的义务。

为提升AR对象分类,Facebook开源Detectron计算机视觉算法

在深度学习算法的镜头下,对象分类是什么样子的

Facebook的人工智能研讨团队与其他相关团队不断在研讨,如何应用深度学习来协助计算机处理对象检测的成绩,而这一基于Caffe2深度学习框架的对象检测算法就叫作Detectron。在正式托管至GitHub后,如今任何人都可以自行尝试。Facebook希望,Detectron开源后能协助世界各地的计算机视觉研讨人员停止新的尝试,并不时改良最新的技术。

该项目的GitHub页面上写道:“Detectron旨在为对象检测研讨提供高质量、高功能的代码库。Detectron的设计非常灵敏,可以支持新研讨的疾速施行与评价。”

为提升AR对象分类,Facebook开源Detectron计算机视觉算法

算法可以检测视频输出,并可以猜想出构成场景的团圆对象。“检测和辨认人类与物体的交互作用 (Gkioxari et al)”等研讨项目曾经在运用Detectron了,并以其为根底来理解人类在特定环境中应用物体作出的行为。这是向正确的方向迈出的一步,以协助计算机了解我们正在做的事情,从而可以为繁忙的我们提供有价值的信息。

除了人工智能研讨之外,Detectron还被用于Facebook的其他外部团队;Facebook在Detectron的开源声明中写道:“各支团队正在应用这个平台来为各种使用停止定制模型训练,其中也包括加强理想和社区完好性研讨。”

目前尚不清楚详细是哪支团队正在把Detectron用于加强理想,不过很能够就是Oculus。早在F8大会时期,Oculus的首席迷信家Michael Abrash就曾讨论过,加强理想将如何并于何时彻底改动我们的生活。

来源:青亭网