农企新闻网

全体 or 部分?阿里 CVPR 论文用全新几何角度构建 GAN 模型

发布者:高楠
导读阿里集团阿里巴巴达摩院机器智能技术实验室阿里AI Labs阿里集团+39AI影响因子论文称号:CVPR工夫:2018企业:阿里巴巴阿里巴巴达摩院机器智能技术实验室+10AI影响因子论文称号:CVPR工夫:2018企业:阿里巴巴阿里AI Labs+64AI影响因子论文称号:CVPR工夫:2018企业:阿里巴巴雷锋网(大众号:雷锋网)AI 科技评论按:本论文由阿里巴巴达摩院机器智能技术实验室华先胜团队
  • 阿里集团
  • 阿里巴巴达摩院机器智能技术实验室
  • 阿里AI Labs
整体 or 局部?阿里 CVPR 论文用全新几何角度构建 GAN 模型 阿里集团 +39 AI影响因子 论文 称号: CVPR 工夫: 2018 企业: 阿里巴巴 整体 or 局部?阿里 CVPR 论文用全新几何角度构建 GAN 模型 阿里巴巴达摩院机器智能技术实验室 +10 AI影响因子 论文 称号: CVPR 工夫: 2018 企业: 阿里巴巴 整体 or 局部?阿里 CVPR 论文用全新几何角度构建 GAN 模型 阿里AI Labs +64 AI影响因子 论文 称号: CVPR 工夫: 2018 企业: 阿里巴巴

雷锋网 (大众号:雷锋网) AI 科技评论按:本论文由阿里巴巴达摩院机器智能技术实验室华先胜团队与 UCF 齐国君教授指导的 UCF MAPLE 实验室协作完成,被 CVPR 2018 收录为 poster 论文。

从学术开发和企业活动上看,阿里巴巴达摩院机器智能技术实验室在雷锋网学术频道 AI 科技评论旗下数据库项目 「AI 影响因子」 中有不错的表现。实验室辨别在 SQuAD 和 KITTI 竞赛中取得第一名,近期在 AAAI 2018 上, 达摩院机器智能技术实验室共有 4 篇论文被录用 ,在CVPR呼吁行业者在政府部门出台相关政策标准的之前,从业者一定要规范自己的行为准则健康有序的快速发展。 2018上,也有多篇论文被录用,成果斐然。

以下为论文引见:

GAN 自降生以来吸引了众多相关的研讨,并在实际、算法和使用方面获得了很多严重的打破。我们试图从一个全新的几何角度,用 部分的 观念树立一种与之前经典 GAN 模型所采用的 全体办法 不同的实际和模型,并以此树立和半监视机器学习中 Laplace-Beltrami 算子的联络,使之不再局限于传统的图模型 (Graph) 办法,并在用大批标注样本训练深度学习模型上获得了优良的功能;同时,我们还展现了假如用 Localized GAN (LGAN) 对给定图像在部分坐标系下停止编辑修正,从而取得具有不同角度、姿势和作风的新图像;我们还将进一步提醒如何从流型切向量独立性的角度来解释和处理 GAN 的 mode collapse 成绩。

该任务由 UCF 齐国君教授指导的 UCF MAPLE 实验室 ( MA chine P erception and LE arning) 和阿里巴巴华先胜博士指导的城市大脑机器视觉研讨组协作完成,并将宣布在 CVPR 2018 上。

整体 or 局部?阿里 CVPR 论文用全新几何角度构建 GAN 模型

论文地址: https://arxiv.org/abs/1711.06020

GAN 和基于图模型的半监视机器学习的关系

GAN 除了用来生成数据,我们以为一个十分重要的作用是: 我们第一次有了一个比拟理想的工具,可以用来表示和描绘数据流型 (manifold)。 之前,假如我们想表示流型,普通是借助于一个图模型(Graph)。在图模型里,我们用节点表示数据点,用边表示数据直接的类似性。有了 Graph,我们可以定量计算数据点上函数的变化。比方,在分类成绩中,我们感兴味的函数是分类函数,输入的是数据点的标签。有了基于 Graph 的流型,我们就可以树立一个分类模型:它输入的分类标签在类似样本上具有最小的变化。这个就是一种平滑性的假定,是基于图的半监视办法的中心假定。

整体 or 局部?阿里 CVPR 论文用全新几何角度构建 GAN 模型

上图:基于图的流型表示和半监视分类。

虽然这种基于图的半监视办法获得了很大的成功,但是它的缺陷也是很分明的。当数据点数量十分宏大的时分,构建这样一个 Graph 的代价会十分大。为理解决这个成绩,Graph 为我们提供了一个很好的根底。经过训练失掉的生成器 G(z),其实就是一个十分好的流型模型。这里 z 就是流型上的参数坐标,经过不时变化 z,我们就可以在高维空间中划出一个流型构造。

有了这样一个流型和它的描绘 G,我们可以在数据流型上研讨各种几何构造。比方切向量空间、曲率,进而去定义在流型上,沿着各个切向量,函数会如何变化等等。好了,这里 GAN 就和半监视学习联络起来了。以前我们是用 Graph 这种团圆的后果去研讨分类函数的变化,并经过最小化这种变化去失掉平滑性假定。

如今,有了流型直接的参数化描绘 G(z),我们就能直接去描写一个函数(比方分类成绩中的分类器)在流型上的变化,进而去树立一个基于这种参数化流型的半监视分类实际,而非去借助基于图的流型模型。

详细来说,半监视图流型中,我们常用到 Laplacian 矩阵来做训练;如今,有了参数化的流型后,我们就可以直接定义 Laplace-Beltrami 算子,从而完成半监视的训练。上面是基于这个办法在一些数据集上失掉的后果。更多的后果可以参考我们的论文「Global versus Localized Generative Adversarial Networks「。

整体 or 局部?阿里 CVPR 论文用全新几何角度构建 GAN 模型

整体 or 局部?阿里 CVPR 论文用全新几何角度构建 GAN 模型

上表:在 SVHN, CIFAR-10 和 CIFAR-100 上的半监视学习效果。

用全局还是部分坐标来研讨 GAN?

这里,有个比拟精密的成绩。通常的 GAN 模型,失掉的是一个全局的参数话模型:我们只要一个 z 变量去参数化整个流型。现实上,在数学上,这种全体的参数化王是不存在的,比方我们无法用一个参数坐标去掩盖整个球面。这时我们往往要借助于经过若干个部分的坐标系去掩盖整个流型。

同时,运用部分坐标系的另一个愈加实践的益处是,我们给定一个目的数据点 x 后,全体坐标系 G(z) 要求我们必需晓得对应的一个参数坐标 z;而运用部分坐标系后,我们就直接可以在 x 左近去树立一个部分坐标系 G(x,z) 去研讨流型四周的几何构造,而不必去解一个逆成绩去去它对应的 z 了。这个极大中央便了我们处置流型上不同数据点。

整体 or 局部?阿里 CVPR 论文用全新几何角度构建 GAN 模型

上图:流型的部分参数化表示。

沿着这个思绪,我们可以应用参数化的部分坐标和它表示的流型来研讨一系列成绩。

  • 1. 比拟实际的研讨可以专注我国这片创新热土正在发生一场全面而深刻的产业结构变革。于,有了这些部分参数表示,如何去定义出一整套黎曼流型的数学构造,比方部分的曲率,黎曼度量,和假如沿着流型去算测地线和两个数据点之间的测地间隔。

  • 2. 从使用的角度,给定了一个图像 x,用部分表示 G(x,z) 可以对这个 x 在它的部分范畴中做各种编辑操作或许控制图像的各种属性,从而可以协助我们生成想要的图像 ;比方不同角度的人脸、人体姿势、物体,甚至不同作风、表现不同情感的图像等等。这在安防、内容生成、虚拟理想等范畴都会有普遍的使用前景。

从几何角度研讨 Mode collapse 成绩

当然,从几何和流型参数化的角度还可以给出对 GAN 更深化的了解,比方对 mode collapse 成绩。在 GAN 的相关研讨中,mode collapse 是一个被普遍关注的成绩。有很多相关的论文在从不同角度来研讨和处理这个成绩。

而基于 Localized GAN 所提醒的几何办法,我们可以从流型部分解体的角度来 解释和防止 GAN 的 mode collapse 。详细来说,给定了一个 z,当 z 发作变化的时分,对应的 G(z) 没有变化,那么在这个部分,GAN 就发作了 mode collapse,也就是不能发生不时延续变化的样本。这个景象从几何下去看,就是对应的流型在这个部分点处,沿着不同的切向量方向不再有变化。换言之,一切切向量不再彼此互相独立--某些切向量要么消逝,要么互相之间变得线性相关,从而招致流型的维度在部分呈现缺陷(dimension deficient)。

为理解决这个成绩,最直接的是我们可以给流型的切向量加上一个正交约束 (Orthonormal constraint),从而防止这种部分的维度缺陷。下图是在 CelebA 数据集上失掉的后果。可以看到,经过对不同的切向量加上正交化的约束,我们可以在不同参数方向上成功地失掉不同的变化。

整体 or 局部?阿里 CVPR 论文用全新几何角度构建 GAN 模型

上图:在给定输出图像的部分坐标系下对人脸的不同属性停止编辑。

值得留意的是,虽然我们是从部分 GAN 的角度推导和完成了对切向量的正交化约束, 这个思绪和办法异样适用于传统的全体 GAN 模型。 我们只需求在训练全体 GAN 模型的同时,在每个训练数据样本或许一个 batch 的子集上也加上这个约束来求取相应的下降梯度就异样可以训练全体 GAN 模型;这个方向可以引申出将来的相关任务。

雷锋网版权文章,未经受权制止转载。概况见。