农企新闻网

GANs 造假术领衔,看 2018 最具落地潜力的 9 大 AI 技术趋向

发布者:张熙
导读雷锋网 AI 科技评论按:本文是 Alex Honchar 在 Medium 上发布的三篇系列博客之二。这三篇博客辨别从 AI 研讨者、产业界的使用开发人员、普通人的角度引见了作者关于 2018 年人工智能开展趋向的看法。雷锋网 AI 科技评论对原文停止了编译。在第一篇 AI 研讨趋向的文章中我尝试引见了 2018 年人工智能研讨范畴中能够发作重要开展的方向。虽然做人工智能的实际研讨很酷,但是也存

雷锋网 AI 科技评论按:本文是 Alex Honchar 在 Medium 上发布的三篇系列博客之二。这三篇博客辨别从 AI 研讨者、产业界的使用开发人员、普通人的角度引见了作者关于 2018 年人工智能开展趋向的看法。雷锋网 AI 科技评论对原文停止了编译。

在 第一篇 AI 研讨趋向的文章中 我尝试引见了 2018 年人工智能研讨范畴中能够发作重要开展的方向。虽然做人工智能的实际研讨很酷,但是也存在一些详细的 AI 技术,它们在 2017 年曾经成熟并且将有能够在 2018 年失掉大规模的商业使用。这也正是本文所要讨论的内容——我将向你引见一些技术,这些技术也答应以使用到你以后的任务中,或许用于构建本人的初创项目。

重要提示:本文给出了一份 AI 范畴算法或技术的清点,它们曾经相当成熟,这意味着可以直接运用。例如,你可以在清点中看到 工夫序列剖析(Time series analysis) ,由于 深度学习正在信号处置范畴迅速替代传统的优秀办法 。但是在这份清点中,你看不到强化学习(Reinforcement learning),虽然强化学习也许愈加好玩,但是在我看来,它以后还不够成熟,缺乏以使用到商业开发中去。但是强化学习的确是一个令人惊叹、一日千里的研讨范畴。

再次提示一下,这是三篇系列文章的其中一篇,在这个系列文章中我尝试 从三个不同的角度分享我对人工智能在将来一年开展趋向的看法

  • AI 研讨员,担任推进人工智能范畴的研讨

  • AI 开发者,担任将 AI 算法落实到商业场景中

  • 生活在这个 AI 新时代的普通群众

希望各位读者能找到本人喜欢的内容,并且有所播种!

PS:在本文我不引见图像辨认和一些复杂的计算视觉成绩,毕竟这块曾经开展好几年了。

GANs 和造假术

虽然 生成对立网络 (Generative adversarial networks, GANs)曾经被提出来好几年了,我仍然对它十分疑心。并且虽然生成对立网络曾经在 64x64 分辨率的图像上获得了宏大的提高却仍然无法消除我的疑虑。然后在我阅读了相关的数学文章之后,我愈加疑心生成对立网络现实上并没有学习到数据散布。但是这一点在往年有所改观,首先是新颖风趣的架构(如 CycleGAN )的提出和实际性的提升( Wasserstein GAN )促使我在理论中尝试了生成对立网络,然后它们的效果也还可以。另内在两次使用过生成对立网络之后,我开端被它深深折服,并且开端深信我们必需运用生成对立网络停止对象生成。

首先,我十分喜欢英伟达的关于 生成真实逼真的全高清图像的研讨论文 (前一年仅能完成 64x64 的图像生成):

GANs 造假术领衔,看 2018 最具落地潜力的 9 大 AI 技术趋势

但是我真正喜欢的(作为一个骚年的完满梦想使用顺序),并且让我留下深入印象的是生成假的色情电影:

GANs 造假术领衔,看 2018 最具落地潜力的 9 大 AI 技术趋势

我也看到了生成对立网络在很多游戏行业中的使用。比方用 GAN 生成景观、英雄乃至整个世界。而且我以为生成对立网络造假的才能将越来越强。

神经网络的一致格式

古代开展(不只是 AI 范畴)的一个重要成绩是,我们往往可以拥有几十个不同的框架来做同一件事情。现今,每个停止机器学习研讨的大公司都必需拥有本人的框架: 谷歌 、 Facebook 、 亚马逊 、 微软 、 英特尔 ,甚至是 索尼 和 优步 以及许多的其它开源方案!在单个 AI 使用中我们会希望采用不同的框架,比方计算机视觉成绩采用 Caffe2,NLP 采用 PyTorch,引荐零碎采用 TensorFlow/Keras。但是接上去将这些模块兼并却需求破费少量的开发工夫,这使得数据迷信家和软件开发人员无法将留意力集中于更重要的义务中。

该处理方案必需是一个一致的神经网络格式,它可以随便地从恣意框架中取得,然后开发人员可以随便完成部署,迷信家可以随便上手运用。而这就是 onNX :

GANs 造假术领衔,看 2018 最具落地潜力的 9 大 AI 技术趋势

现实上,它只是 非循环计算图 (Acyclic computational graphs)的复杂格式,但在理论中它给我们提供了部署复杂 AI 使用方案的时机。而且我团体发现它十分有吸引力的一点是——人们可以在那些没有弱小部署工具和不依赖于 TensorFlow 生态零碎的框架中停止开发,比方 PyTorch。

模型库暴增

三年前,人工智能范畴最令人兴奋的事情是 Caffe 的模型库(Caffe Zoo)。事先我正在从事与计算机视觉有关的任务,我事先尝试了一切的模型,并且逐一反省了它们的任务机制以及运转效果。之后我运用这些模型停止完成迁移学习(Transfer learning)或许用于特征提取。最近我运用了两种不同的开源模型,作为一个大型计算机视觉义务的数据流处置管道的一局部。这意味着什么呢?这意味着实践上我们没必要去训练本人的网络模型,例如,对 ImageNet 对象辨认或许地点辨认,这些根底的东西可以直接下载并添加到你的零碎中去。除了 Caffe 模型库,其它的框架也有着相似的模型库。但是让我最吃惊的是,你可以 直接将计算机视觉、NLP 甚至是减速度计信号处置模型拔出到 iPhone 中 :

GANs 造假术领衔,看 2018 最具落地潜力的 9 大 AI 技术趋势

我以为这些模型库将越来越多,并且会呈现像 onNX 这样的生态零碎,然后这些模型也将愈加集中(也会运用 ML 区块链使用来去中心化)。

AutoML 设计办法交换

设计一个神经网络的体系构造是一个苦楚的义务——有时你可以经过复杂地堆叠卷积层失掉相当好的后果,但是大少数时分,你需求凭仗经历和超参数搜索办法(例如,随机搜索或贝叶斯优化)十分细心地设计网络的宽度、深度和超参数。特别是当你不在计算机视觉范畴展开研讨时,你可以微调一些在 ImageNet 上训练的 DenseNet。但是关于 3D 数据分类或许多变量工夫序列使用则不行。

有许多人尝试过运用一个神经网络从头开端创立另一个神经网络架构,但是对我而言,最好的也是最便捷的是 Google Research 的 AutoML :

GANs 造假术领衔,看 2018 最具落地潜力的 9 大 AI 技术趋势

他们用 AutoML 来生成的计算机视觉模型,比人类手工设计的网络还要更快和更好 。我置信很快就会有很多关于这个话题的论文和开源代码了。

技术栈

关于这个概念,我在 Anatoly Levenchuk 的博客上看到了很多。Anatoly Levenchuk 是一名来自俄罗斯的零碎剖析师、教练和 AI 喜好者。在上面的图片中,你可以看到一个被称为 “AI 栈”的例子:

GANs 造假术领衔,看 2018 最具落地潜力的 9 大 AI 技术趋势

它不只仅包括无机器学习算法和你最喜欢的框架,而且也深化更底层中,并且每个层面都有本人的开展和研讨。

我以为人工智能开发行业曾经拥有了足够多的不同专家,而且曾经足够成熟。在你的团队中只要一名数据迷信家是远远不够的——你需求不同的人员,辨别担任 硬件优化、神经网络研讨、AI 编译器、处理方案最优化和消费施行 。在他们之上必需有不同的团队指导、软件架构师(必需为每个成绩独自设计下面的堆)和管理者。我曾经提到了这个概念,希望在 AI 范畴的技术专家可以在将来生长(关于那些想要成为 AI 或许技术指导者的软件架构师——你需求晓得学习道路)的某种愿景。

基于语音的使用

目前来说人工智能所能处理的精度能到达 95% 以上的成绩十分少:我们可以将图像分红 1000 个类别;我们可以判别文本中的心情是正面的还是负面的;其实我们还可以做一些愈加复杂的事情。我以为还有一个范畴行将迎来商业使用的迸发,那就是语音辨认和生成。现实上,在 DeepMind 的 WaveNet 发布之后的一年内,WaveNet 都还算不错,不过由于最近百度的 DeepVoice 和 Google Tacotron2  的提出,我们在这块走的更远了:

GANs 造假术领衔,看 2018 最具落地潜力的 9 大 AI 技术趋势

这个技术很快就会在开源社区中停止发布(或许被一些聪明人所复制),并且每团体都可以以十分高的精度辨认语音并生成它。它能在哪里派上用场呢?我们将失掉更好的公家助理、自动电子书阅读器、会谈记载器(Negotiation transcripters)以及声响造假。

更聪明的机器人

我们明天所看到的机器人都有一个很大的成绩——其中 99% 基本不是人工智能,它们只是硬编码。这就是为什么 Facebook Messenger 或 Telegram 中的大局部机器人都采用硬编码的命令,或许最好状况也是采用了一些基于 LSTM 和 word2vec 技术的神经网络句子分类器。但是古代最先进的 NLP 技术可不止这样。来看看 Salesforce 做了哪些风趣的 研讨任务 :

GANs 造假术领衔,看 2018 最具落地潜力的 9 大 AI 技术趋势

他们正在构建 NLP 与数据库的接口,克制古代 编码器-解码器自动回归模型 ,不只能为单词或句子训练嵌入向量,而且还能给字符训练向量。此外,还有一个 风趣的研讨 是关于运用强化学习 将 NLP 得分作为 ROUGE 停止最优化

我置信随着这些技术的开展,我们可以经过更多的 智能信息检索 (Intelligent information retrieval)和 命名实体 (Named entity)来进步机器人。甚至在一些封锁域的垂直使用中能够呈现完全由深度学习驱动的机器人。

最佳的工夫序列剖析

在 Salesforce 之后的第二个被低估的公共机器学习研讨实验室是 Uber AI Labs。前端工夫,他们宣布了一篇博客,展现了他们对工夫序列预测的办法。说假话这让我感到受宠若惊,由于我在使用顺序中运用了根本相反的办法!这是 统计特征和深度学习表征相结合 的惊人例子:

GANs 造假术领衔,看 2018 最具落地潜力的 9 大 AI 技术趋势

我最近从事的是基于深度学习的工夫序列剖析,我曾经亲身验证了这个神经网络效果十分好,与“黄金规范(Golden standards)”相比,你可以 随便取得 5-10 倍的功能增长

优化战略也很重要

我们要如何训练我们的神经网络?说假话,大少数人只是运用“Adam()”优化函数和规范的学习率。而一些聪明的人会选择最适宜的优化器,并调整适宜的学习率。由于训练优化的时分我们只需求按下“训练”按钮,然后等候网络收敛,因而这招致人们往往低估了优化中的学问。但是在拥有同等计算力资源、内存和开源代码处理方案的时分,可以在最短工夫内优化训练模型的人将胜出。 这有一篇 2017 年优化算法的改良清点 。

我鼓舞大家看看下面的 Sebastian 的 Ruder 博客,该博客引见了 2017 年最新的一些关于如何确定优化算法,以及其他一些十分有用的复杂改良。

回归感性

GANs 造假术领衔,看 2018 最具落地潜力的 9 大 AI 技术趋势

这张照片能通知我们什么呢?特别是在曾经阅读了这篇文章前几点之后。思索到目前曾经呈现了这么多开源的工具以及算法,要开收回一些新的有价值的东西并且还要从中赚取很多钱并不容易。我以为 2018 年关于像 Prisma 这样的创业公司来说不是最好的一年——由于能够会呈现很多竞争对手,他们可以把开源项目作为挪动使用停止部署,从而开端创业。

往年我们必需专注于根本的事情,而不是挣快钱——即便我们计划运用谷歌的 Ratacon 效劳来完成有声读物的语音辨认,我们也不能单纯地将它作为一个复杂的网络效劳器,而是要想清楚业务形式、协作同伴以取得一些投资。

总结

最初再总结一下,我们有几种技术可以用于实践产品落地: 工夫序列剖析、GANs、语音辨认 。我们不应该再为分类或许回归设计根本架构了,由于 AutoML 将会为我们完成这个。我希望借助一些优化上的进步,AutoML 将运转得比以前更快。然后有了 onNX 和模型库之后我们将可以经过两行代码就完成将模型拔出到使用中去。我以为制造基于 AI 的使用顺序在以后来说是十分容易的,这关于整个工业界而言也是福音。而想晓得新一年里 人工智能研讨范畴 会如何开展请看我 前一篇文章 。

Via AI in 2018 for developers ,雷锋网 (大众号:雷锋网) AI 科技评论编译

相关文章:

辞别低潮迭起的 2017,2018 年人工智能将走向何方?

2017年度好视频,吴恩达、李飞飞、Hinton、OpenAI、NIPS、CVPR、CS231n全都在

2017年里,哪十篇 arXiv 机器学习论文在 Twitter 上最抢手?

2018 年最值得等待的学术停顿——致人工智能研讨者们的年终总结

GANs 造假术领衔,看 2018 最具落地潜力的 9 大 AI 技术趋势