农企新闻网

DeepMind新研讨:运用强化对立学习分解图像顺序

发布者:张书林
导读雷锋网AI科技评论按:近日,DeepMind 宣布的一篇博客中提到了一种新的人工智能体,它可以推断数字,角色和肖像的结构方式。更为关键的是,它们是本人学会做这件事,而不是靠人工标志的数据集。真实的世界并不只仅是我们眼睛里所反映的图像。例如,当我们看修建物并欣赏其设计的复杂性时,我们也欣赏它所需的工艺。这种思想方式可以使我们对世界有愈加丰厚的了解,也是人类智慧的重要表现之一。DeepMind 的研讨

雷锋网AI科技评论按: 近日,DeepMind 宣布的一篇博客中提到了一种新的人工智能体,它可以推断数字,角色和肖像的结构方式。更为关键的是,它们是本人学会做这件事,而不是靠人工标志的数据集。

真实的世界并不只仅是我们眼睛里所反映的图像。例如,当我们看修建物并欣赏其设计的复杂性时,我们也欣赏它所需的工艺。这种思想方式可以使我们对世界有愈加丰厚的了解,也是人类智慧的重要表现之一。

DeepMind 的研讨员希望它们的零碎也能发明出异样丰厚的世界表现方式。例如,察看绘画的图像时,希望零碎能理解用于创立绘画的笔触,而不只仅是表如今屏幕上的像素。

DeepMind新研究:使用强化对抗学习合成图像程序

在这项任务中,研讨员为天然智能体(agents)装备了与人类用来生成图像相反的工具,并证明它们可以推断数字,人物和肖像的结构方式。更关键的是,它们是自学如何做到这一点,而不是经过人为标签的数据集。这与最近的一项研讨「A Neural Representation of Sketch Drawings」提到的依赖从人类经历中学习的方式恰恰相反。依赖于人类经历的学习通常是很耗时的。

DeepMind新研究:使用强化对抗学习合成图像程序

研讨员设计了一个可以与计算机绘画顺序交互的深度强化学习智能体,将笔触放在数字画布上并更改画笔大小,压力和颜色,未经训练的智能体画笔很随意,并没有分明的意图或构造。为了克制这一点,研讨员需求创立一种奖励方式,鼓舞 agents 生成有意义的图片。

为此,研讨员训练了第二个神经网络,称之为鉴别器。它独一目的是预测特定图形是由 agents 制造的,还是从真实照片的数据集中采样的。agents 的奖励是经过「诈骗」鉴别者以为它的绘画是真实的。换句话说,agents 的奖励信号自身就是学习的。虽然这与生成对立网络(GAN)中运用的办法相似,但并不相反。由于 GAN 网络设置中的生成器通常是直接输入像素的神经网络。而这里的 agents 是经过编写图形顺序来与绘图环境交互来生成图像。

DeepMind新研究:使用强化对抗学习合成图像程序

在第一组实验中,agents 经过训练生成相似于 MNIST 数字的图像:它显示了数字的样子,但没有显示它们是如何绘制的。经过在互联网思维的影响下,传统服务业不再局限于规模效益,加强对市场的反应速度成为传统服务业发展的首要选择。在互联网思维下,通过对传统服务业的改革,为传统服务业发展创造了全新的天地。尝试生成诈骗鉴别器的图像,agents 学会控制画笔并操纵它以顺应不同数字的作风,这是一种称为可视化顺序分解的技术。

研讨员也训练它重现特定图像的才能。在这里,鉴别器的目的是确定再现图像能否是目的图像的正本,或许能否由 agents 发生。鉴别器越难区分,agents 失掉的奖励就越多。

最重要的是,这个框架也是可以解释的,由于它发生了一系列控制模仿画笔的举措。这意味着该模型可以将其在模仿绘图顺序中学到的知识使用到其他相似环境中的字符重建中,例如用在仿制的或真实的机械臂上。

rame width="640" height="498" src="https://v.qq.com/iframe/player.html?vid=c0616yoeev8&tiny=0&auto=0" frameborder="0" allowfullscreen="">rame>

还有能够将这个框架扩展到真实的数据集。agents 经过训练可以绘制名人脸部表情,可以捕获到脸部的次要特征,例如外形,色彩和发型,就像街头艺术家在运用无限数量的画笔描画肖像时一样:

DeepMind新研究:使用强化对抗学习合成图像程序

从原始感受中提取信息构造化表示是人类很容易拥有并常常运用的才能。在这项任务中,研讨员标明可以经过让智能体取得和人类重现世界的相反工具来指点智能体发生相似的表示。在这样做时,它们学会制造可视化顺序,简约地表达因果关系,提升了它们的察看力。虽然该任务目前仅代表了向灵敏的顺序分解迈出一小步,但估计需求相似的技术才干使智能体具有相似人的认知,包括归结概括和沟通交流等才能。

相关论文 :Synthesizing Programs for Images using Reinforced Adversarial Learning 

雷锋网编译

via DeepMind

雷锋网 (大众号:雷锋网) 原创

DeepMind新研究:使用强化对抗学习合成图像程序