农企新闻网

GPU、FPGA芯片成为加强机器学习的“左膀右臂”

发布者:金楠东
导读本文系网易智能任务室(大众号smartman 163)出品。聚焦AI,读懂下一个大时代!【网易智能讯6月17日音讯】在商业软件中,电脑芯片已被遗忘。关于商业使用顺序来说,这是一种商品。由于机器人技术与团体硬件设备联络更为严密,因此制造使用顺序依然更侧重于硬件局部。自20世纪70年代以来,全体上看,人工智能(AI)的现状,以及详细到深度学习(DL)范畴,硬件与软件的关系比任何时分都联络地愈加严密。而

GPU、FPGA芯片成为增强机器学习的“左膀右臂”

本文系网易智能任务室(大众号smartman 163)出品。聚焦AI,读懂下一个大时代!

【网易智能讯6月17日音讯】在商业软件中,电脑芯片已被遗忘。关于商业使用顺序来说,这是一种商品。由于机器人技术与团体硬件设备联络更为严密,因此制造使用顺序依然更侧重于硬件局部。

自20世纪70年代以来,全体上看,人工智能(AI)的现状,以及详细到深度学习(DL)范畴,硬件与软件的关系比任何时分都联络地愈加严密。而我最近几篇“管理人工智能(management AI)”的文章与过度拟合和成见有关,机器学习(ML)零碎中存在的两个次要风险。本专栏将深化讨论许多管理人员,尤其是业务线经理能够会处置的硬件缩略词成绩,这些缩略词在机器学习零碎中被不时提及:图形处置单元(Graphics Processing Unit ,GPU)和现场可编程门阵列(Field Programmable Gate Array ,FPGA)。

这有助于了解GPU的价值,由于GPU减速了深度学习使用顺序所需的张量(tensor)处置。FPGA的兴味点则在于寻觅研讨新AI算法的途径,训练这些零碎,并开端部署如今正在许多工业AI使用中研讨的低容量定制零碎。虽然这是关于FPGA停止训练的才能研讨讨论,但我以为晚期运用是源于F,现场(field)的运用。

例如,训练一个推理引擎(机器学习“机器”的中心)能够需求千兆字节,甚至兆兆字节的数据。在数据中心运转推理时,计算机必需管理一个潜在的不时添加中的并发用户恳求数。在边缘使用顺序中,无论是在用于反省管道的无人机中还是在智能手机中,设备都必需很小且依然无效,而且还具有顺应性。复杂地说,一个CPU和一个GPU是两个器件,而一个FPGA可以有不同的块做不同的事情,并有能够提供一个稳健的芯片零碎。鉴于一切这些不同的需求,最好理解可支持不同需求的零碎架构的以后形态。

有两类次要的芯片设计可以驱动以后的ML零碎,GPU和FPGA。在将来的中期(至多几年),也有能够成为游戏转换者的新技术暗示。让我们来看看。

图形处置单元(GPU)

GPU、FPGA芯片成为增强机器学习的“左膀右臂”

机器学习世界中最大的芯片是图形处置单元GPU。这个次要用于电脑游戏,让其在计算机显示器上看起来更好的东西是如何变得对机器学习至关重要的?要了解这一点,我们必需回到软件层。

机器学习目前的冠军是Deep Learning(DL)零碎。DL零碎基于各种算法,包括深度神经网络(DNN),卷积神经网络(CNN),递归神经网络(RNN)以及许多其他变体。你在这三个术语中看到的关键词是“网络(network)”。算法是一个主题的变体,主题是几层节点, 节点和层之间有不同类型的通讯。

正在处置的是多个阵列或矩阵。矩阵(matrix)的另一个更为准确的术语是张量(tensor),因而它在整个机器学习行业中用于诸如TensorFlow之类。

如今回到你的电脑屏幕。您可以将它按行和列看作是像素或点的矩阵。这是一个二维矩阵或张量。当你添加颜色,添加到每个像素的位大小,想要一个疾速变化的分歧图像的时分,计算可以很快变得复杂并且在一步一步的CPU中占用周期。而GPU拥有本人的内存,可以将整个图形图像保管为矩阵。然后可以运用张量数学计算图像中的变化,然后只更改屏幕上受影响的像素。这个进程比每次更改图像时重新绘制整个屏幕要快得多。

NVIDIA于1993年,旨在创立一个芯片来处理诸如CPU等通用计算机无法处理的矩阵成绩。这是GPU的降生。

矩阵运算并不关怀最终产品是什么,而只是处置元素。这是一种细微的过度简化,由于不同的运算依稀疏矩阵(当有很多零时)与密集矩阵的不同而有不同的任务方式,但内容不会改动运算,这个现实仍然存在。当深度学习实际学者看到GPU的开展时,他们很快就采用其来减速张量运算。

GPU对机器学习的开展至关重要,推进了数据中心的训练和推理。例如,NVIDIA Volta V100 Tensor Core在其根本架构和以更低精度运转推理的才能方面持续减速推进(这将是另一个话题,意味着更少的位,即意味着更快的处置)。但是,当触及物联网时还有其他成绩需求思索。

现场可编程门阵列(FPGA)

GPU、FPGA芯片成为增强机器学习的“左膀右臂”

在现场(field)中,一切类型的使用顺序都有不同的需求。有很多不同的使用范畴,车辆,管线,机器人等等。不同行业可以为每品种型的使用设计不同的芯片,但这能够会十分昂贵并且会毁坏公司的投资报答率。还能够推延上市工夫,错过重要的商业时机。关于那些不能提供足够规模经济市场的高度特性化需求而言,状况尤其如此。

FPGA是协助公司和研讨人员处理成绩的芯片。FPGA是一种集成电路,可以编程为多种用处。它有一系列“可编程逻辑块”和一种编程块和块之间关系的办法。它是一种通用工具,可以为多种用处停止定制。次要供给商包括赛灵思(Xinlinx)和美国国度仪器(National Instruments)。

值得留意的是,芯片设计本钱较低的成绩并不能使FPGA成为低价位的选择。它们通常最适用于研讨或工业使用。电路和设计的复杂性使其可编程,不适用于低本钱的消费类使用。

由于FPGA可以重新编程,这使得其关于新兴的机器学习范畴来说很有价值。不时添加算法,并经过重新编程块来针对不同算法停止微调。此外,低精度推断的低功耗FPGA关于近程传感器来说是一个很好的组合。虽然创造人将“现场(field)”更多地称为“客户(customer)”,但FPGA在完成AI使用方面的真正优势在实践范畴中。无论是关于工厂、路途和管道等根底设备,还是无人机近程检测,FPGA都允许零碎设计人员灵敏地运用一块硬件,以完成多种用处,从而完成更复杂的物理设计,从而可以愈加容易地停止现场使用。

新体系构造行将到来

GPU和FPGA是目前正在协助处理如何扩展机器学习对许多市场影响的应战的技术。他们所做的是让更多人关注这个行业的开展,并试图及时创立新的架构来使用。

一方面,许多公司试图在GPU上学习张量运算的经验。惠普、IBM和英特尔都有开发专门用于深度学习的下一代张量运算设备的项目。与此同时,像Cambricon、Graphcore和Wave Computing这样的初创公司也在努力做异样的事情。

另一方面,Arm、Intel和其他公司正在设计架构,以充沛应用GPU和CPU,并使器件也瞄准机器学习市场,据称可以做的不只仅是集中张量运算,关于围绕中心AI流程的其他处置也愈加弱小。

虽然上述一些组织专注于数据中心和其他物联网,但如今议论其中的任何一个都为时髦早。

从全球公司到初创公司,一个劝诫是,除了最早的信息外,还没有其他信息呈现。假如我们最迟在2020年看到最早的器件样品,那么这将是一个惊喜,所以它们至多在五年内不会上市。

(选自:forbes 作者:David A. Teich  编译:网易智能  参与:nariiy)

关注网易智能大众号(smartman163),为你解读AI范畴大公司大事情,新观念新使用。