农企新闻网

从功能层、框架层动手,澎峰科技提供嵌入式AI处理方案深挖终端计算功能

发布者:马阳明
导读把人工智能做到终端上去已成为物联网时代开展的一个趋向,在智能终端设备上,深度学习带来了史无前例的交互体验革新,同时也对计算力有了更高的要求。在诸多实践的AI商用场景中,普遍对数据处置的实时性和速度要求都比拟高,不能够一切数据都上传到云端跑一遍,因而目前市场上有从公用嵌入式AI芯片动手来处理终端计算才能成绩的,也有的厂商努力于最大化发掘终端的计算功能进而完成事半功倍的计算效果。猎云网日前采访到的澎峰

把人工智能做到终端上去已成为物联网时代开展的一个趋向,在智能终端设备上,深度学习带来了史无前例的交互体验革新,同时也对计算力有了更高的要求。

在诸多实践的AI商用场景中,普遍对数据处置的实时性和速度要求都比拟高,不能够一切数据都上传到云端跑一遍,因而目前市场上有从公用嵌入式AI芯片动手来处理终端计算才能成绩的,也有的厂商努力于最大化发掘终端的计算功能进而完成事半功倍的计算效果。

猎云网日前采访到的澎峰科技的技术思绪就是从使用算法层、框架层、功能层和硬件层综合考量提供嵌入式AI全体处理方案,为终端深度学习算法提供减速引擎,充沛发掘终端计算功能。

澎峰科技开创人兼CEO张先轶在2007年硕士毕业之后进入中科院软件所任务,不断从事高功能计算、功能优化、矩阵计算等方面的研讨任务。2011年,读博时期张先轶率领小组创立了一个开源矩阵计算库——OpenBLAS,目前他也是该项目的次要维护者,在矩阵计算的细分范畴,这是一个影响力较大的开源项目。

假如不是开发者,能够不太清楚OpenBLAS的价值所在,OpenBLAS支持简直全部的主流CPU处置器和罕见的操作零碎,同时都能到达比拟好的功能优化,进入了很多主流的Linux装置包,其用户普遍,从开源项目Julia言语、GNU octave,到深度学习的mxnet、Caffe,乃至IBM、ARM、英伟达等公司也都在他们的产品里边运用了OpenBLAS。

从性能层、框架层入手,澎峰科技提供嵌入式AI解决方案深挖终端计算性能

2014年底张先轶分开中科院去了美国,先后在UT Austin做研讨员以及MIT博士后等科研任务阅历,辗转两所知名高校探究最新的技术方向,彼时,深度学习和人工智能逐步衰亡,在大洋此岸的中国,更是掀起了一场史无前例的技术革新浪潮。

“在MIT的阅历关于我创业来说比拟关键,那里的创业气氛十分好,各种创业竞赛比拟多,还有一个中国留先生的创业论坛。”经过一些沙龙和组织活动,张先轶结识了很多一线创业者吸取创业经历和协助,正在犹疑接上去是留美任务还是回国的节点上,他最终作出了回国创业的决议。

张先轶表示:“我们看到人工智能的确变得很火,而我们其实做高功能计算有一些很底层的技术,在人工智能方向的使用范畴将会越来越广,比方说基于OpenBLAS或其他底层技术对提升AI计算功能是非常适宜的,而且越来越多的公司会有需求,这些技术将有很可观的商业市场,所以事先就觉得这个方向应该是对的,武断出来做这个。”

2016年下半年澎峰科技注册成立,交接竣工作的张先轶年底回国开端组建本人的团队,除了本人比拟擅长的底层算法框架,团队也强化了软硬件基因,中科院背景的贾海鹏博士参加担任软件研发停顿,华中科技大学赵华龙博士担任硬件产品集成。

从性能层、框架层入手,澎峰科技提供嵌入式AI解决方案深挖终端计算性能

澎峰科技的技术优势就是可以辨别从使用算法层、框架层、功能层和硬件层切入做计算功能的综合优化和提升。

在框架层,澎峰科技开源了一种轻量级的深度学习推理框架inferXlite,相比拟目前的传统通用框架具有小、轻、快的优势,代码<100k,接口支持任何网络模型,可移植任何硬件平台,简直没有依赖库,框架设计与功能减速别离,从框架层面关于算法减速给予了充沛的考量。

为何要把这么一套框架做开源?张先轶有本人的思索:“其实还是想进一步树立我们技术的佳誉度,然后吸引更多开发者来用我们的东西,关于公司久远的开展这是一个比拟好的做法。作为我们这样的技术公司直接去推和销售不一定能做的多么广,而由开发者实践体验后对将来的商业转化更无益处,另外,直白点说,也能显示我们做的技术比拟牛。”

在功能层,澎峰科技推出了三款产品:深度学习优化矩阵计算库PerfBLAS、深度神经网络计算库PerfDNN、以及高功能计算机视觉库PerfCV。PerfBLAS针对ARM等嵌入式平台停止深度学习卷积算法优化,可普遍用于挪动平台,手机、机器人、无人机等范畴。PerfDNN是一个跨平台的轻量级深度学习算法库,完成了深度神经网络的中心算法;PerfCV是一个跨平台高功能计算机视觉库,完成了深度学习中次要的图像预处置算法,包括cvtColor、resize、warm_affine、warm_perspective等,PerfCV可在GPU、x86、ARM等多个硬件平台上完成高功能。

从性能层、框架层入手,澎峰科技提供嵌入式AI解决方案深挖终端计算性能

此外,澎峰科技还提供了一套深度神经网络自动量化工具DL-Quants,相比浮点运算,定点运算等关于存储和计算资源的占用更小、功耗更低、效率更高,可面向FPGA、嵌入式ARM等诸多嵌入式平台运用。

基于中心的软件框架和多种计算库,澎峰科技得以集成出一体化的硬件产品:嵌入式深度学习开发平台PerfBox和Perf-V工程板。据理解,PerfBOX采用六核64位ARM处置器,集成了ARM Mali-T860四核GPU,并拥有2GB/4GB DDR3和16G/32GB的eMMC,可用来做为学习、开发、部署深度学习使用的平台。Perf-V工程板则是澎峰科技为RISC-V开源社区设计的FPGA开发板,具有很强的灵敏性,移植了多种RISC-V处置器架构,并装备丰厚的学习材料,为RISC-V处置器设计和FPGA产品开发提供了一个很好的实验平台。

谈到公司的技术产品规划,张先轶表示,目前做CEO其实就相当于是一种产品经理的角色,技术出身的团队如何转换成产品思想很重要。“我们能够在计算功能优化上有一些十分突出的亮点,但单靠这一亮点技术不会那么好卖,特别是在国际,大家更希望还是要外包成一个处理方案或产品,这种承受水平才会高出很多。客户拿过来做一些复杂的二次开发就可以用,这种全体性集成性更高一些,对客户的便当水平也会更多一些。”

从性能层、框架层入手,澎峰科技提供嵌入式AI解决方案深挖终端计算性能

据理解,澎峰科技的目的客户群体,大约分为两品种别,但可本次涌现的 AI、区块链和物联网热潮不同于以往,将对产业、社会和生活产生真正堪称“颠覆性”的变革。IT 技术人员需要全方位地“换脑”:对原有的知识结构进行全面刷新,全面升级。以确定是终端为主,偏视觉计算处置的方向,由于计算机视觉范畴对计算功能的需求更为激烈。一类客户是挪动APP类使用,澎峰科技可以提供整套优化技术的软件包SDK给客户嵌入到APP中,这局部次要是以提供软件效劳为主;另一方面就是提供PerfBox硬件产品和Perf-V工程板,会面向智能硬件和智能终端设备的厂商,依据详细需求做灵敏配置比方存储、内存、芯片的选型等,软硬优势互补从全体考量上提供高性价比的嵌入式方案。

张先轶说:“关于客户来讲,我们一个比拟大的优势是没有给他绑定绝对的硬件平台,可适配的芯片品种比拟多,更跨平台一些。比方客户想规划不同的产品道路,假如他再用不同的芯片选型会十分的费事,而我们的效劳可以十分地加重他们的开发任务量,更快地推出产品。

目前,澎峰科技已完成了两轮融资,天使轮取得紫牛基金与明势资本的550万元起步资金支持,近期又完成了由丰厚资本、泽厚资本投资的千万级pre-A轮融资。

项目:嵌入式AI处理方案提供商
公司:澎峰(北京)科技无限公司
网址: www.perfxlab.com

AD: 6月15日,北京千禧大酒店!猎云网将与您相约“破界·推翻——猎云网2018年度区块链产业峰会”,共同见证行业嘉宾的思想洞见与最新前沿趋向!