一看就会！英伟达新研讨教机器人仅经过察看人类行为完成义务

2026-07-16 20:53:54

导读大众号/新智元新智元编译来源：news.developer.nvidia.com翻译：肖琴NVIDIA的研讨人员开发了第一个可以教机器人仅经过察看人类的行为来完成义务的深度学习零碎。该办法应用分解数据来训练神经网络，是第一次在机器人上运用以图像为中心的域随机化办法。论文地址：https://arxiv.org/abs/1805.07054来自NVIDIA的研讨人员开发了一个基于深度学习的零碎，该零

大众号/新智元

新智元编译

来源：news.developer.nvidia.com

翻译：肖琴

NVIDIA的研讨人员开发了第一个可以教机器人仅经过察看人类的行为来完成义务的深度学习零碎。该办法应用分解数据来训练神经网络，是第一次在机器人上运用以图像为中心的域随机化办法。

一看就会！英伟达新研究教机器人仅通过观察人类行为完成任务

论文地址：https://arxiv.org/abs/1805.07054

来自NVIDIA的研讨人员开发了一个基于深度学习的零碎，该零碎可以教机器人仅经过察看人类的行为来完成义务。该办法旨在增强人与机器人之间的交流，同时进一步研讨如何使人类无缝地与机器人一同任务。这是第一个这样的零碎，研讨由Stan Birchfield和Jonathan Tremblay指导。

“要想让机器人在理想世界中执行有用的义务，必需要能很容易地将义务传达给机器人。这包括预期的后果以及任何关于到达该后果的最佳办法的提示。”研讨人员在他们的研讨报告中指出。“经过演示，用户可以将义务传达给机器人，并向机器人提供如何以最佳的方式执行义务的线索。”

研讨人员运用NVIDIA TITAN X GPU训练了一系列神经网络来执行与 感知、顺序生成和顺序执行 相关的义务。后果显示， 机器人可以经过察看理想世界的单个演示来学习义务 。

一看就会！英伟达新研究教机器人仅通过观察人类行为完成任务

该办法的任务方式：一个摄像机被用来捕捉场景的实时视频流，并且经过两个神经网络实时地对场景中对象的地位和关系停止推断。由此发生的知觉被输本次涌现的 AI、区块链和物联网热潮不同于以往，将对产业、社会和生活产生真正堪称“颠覆性”的变革。IT 技术人员需要全方位地“换脑”：对原有的知识结构进行全面刷新，全面升级。出到另一个网络中，该网络生成一个解释如何重建这些感知的方案。最初，一个执行网络读取该方案并为机器人生成举措，同时思索到以后场景的形态，以确保对内部搅扰的稳健性。

一旦机器人失掉一个义务，它就会生成一个 人类可读取的 关于重新执行该义务所需步骤的描绘。该描绘让用户可以在机器人执行之前疾速辨认和纠正机器人对人类演示的解释中的成绩。

完成这种才能的关键是 应用分解数据来训练神经网络 。目前训练神经网络的办法需求少量有标志的训练数据，这对这类零碎来说是一个瓶颈。经过分解数据生成，不必太费力就可以生成简直有限的标志训练数据。

这也是第一次在机器人上运用 以图像为中心的域随机化办法 。域随机化（domain randomization）是一种发生少量多样性的分解数据的技术，然后捉弄感知网络将真实世界的数据看作是其训练数据的另一种变体。研讨人员选择以图像为中心的方式处置数据，以确保网络不依赖于摄像机或环境。

研讨人员说：“如描绘所示，这个感知网络适用于任何固态的理想世界物体，这些物体可以经过其3D边界立方体（bounding cuboid）来模仿。”“虽然训练进程中从未察看到真实的图像，但感知网络可以在真实图像中牢靠地检测到物体的bounding cuboid，即便在有严重的遮挡的状况下也是如此。”

在他们的演示中，研讨团队用几个黑色积木和一辆玩具汽车训练目的检测器。零碎被教授“块”（blocks）的物理关系，不论这些“块”是堆叠在一同还是彼此相邻放置。

rame src="https://v.qq.com/txp/iframe/player.html?origin=https%3A%2F%2Fmp.weixin.qq.com&vid=n0661gtqg2t&autoplay=false&full=true&show1080p=false" width="652" height="366.75" frameborder="0" allowfullscreen="allowfullscreen" data-mce-fragment="1">rame>

在下面的演示视频中，人类操作员向机器人展现了一组立方块。零碎然后推断一个适当的顺序并按正确的顺序将立方块正确地放置好。由于它在执行进程中会思索以后世界的形态，因而零碎可以实时地从错误中恢复过去。

研讨人员将在本周于澳大利亚布里斯班举行的机器人与自动化国际会议（ICRA）上宣布他们的研讨论文和任务。

该团队表示，他们将持续探究运用分解训练数据停止机器人操纵，以将他们的办法扩展到其他场景。

论文地址：https://arxiv.org/abs/1805.07054

免责声明：本文章由会员“李书林”发布如果文章侵权，请联系我们处理，本站仅提供信息存储空间服务如因作品内容、版权和其他问题请于本站联系

标签：