农企新闻网

星环科技孙元浩:2018年人工智能技术三大开展方向

发布者:刘夕
导读图:星环科技孙元浩2017年AI成为最炽热的技术词汇,少量资本涌入这个范畴,在中国催生了一批创业公司,在美国催生了少量的收买。这意味着AI到了泡沫的高峰,并且还将继续一两年。AI不是一个新的词汇,而是曾经开展几十年的技术。从晚期的逻辑推理阶段,到专家零碎/归结学习,到机器学习阶段,再到如今的深度学习阶段,每个阶段都发生一些技术打破,也发明过一系列泡沫。例如在2000年左右第一轮互联网泡沫期,希望用

星环科技孙元浩:2018年人工智能技术三大发展方向

图:星环 科技 孙元浩

2017年AI成为最炽热的技术词汇,少量资本涌入这个范畴,在中国催生了一批 创业 公司,在美国催生了少量的收买。这意味着AI到了泡沫的高峰,并且还将继续一两年。

AI不是一个新的词汇,而是曾经开展几十年的技术。从晚期的逻辑推理阶段,到专家零碎/归结学习,到机器学习阶段,再到如今的深度学习阶段,每个阶段都发生一些技术打破,也发明过一系列泡沫。例如在2000年左右第一轮 互联网 泡沫期,希望用AI让机器可以了解互联网,由此催生了semantic web,目的是让机器可以本人了解信息并且机器间可以自在沟通。 随着 VR 技术的开展,又呈现了一批AI驱动的虚拟人/虚拟助理,可以与人自在交谈,事先异常火爆的Second Life是这个阶段的典型代表。在影视作品中,《黑客帝国》把机器智能想象到了极致,人完全沦为机器发生动力的电池,世界全部是由计算机发明和控制的;《人工智能》和《我,机器人》则给机器人赋予了感情,并将引发新的反动。但是过来每一次技术提高,没有带来人们想象中的使用打破,我以为除了算法缺乏打破外,重要缘由是受限于计算力和数据。

星环科技孙元浩:2018年人工智能技术三大发展方向

2006年开端大数据技术失掉迅猛开展,从晚期的散布式存储和计算零碎(HDFS/Map/Reduce 2006-2009),到SQL on Hadoop (2010-2014是焦点阶段)技术的逐步成熟,曾经处理了大规模数据的存储和统计成绩,当大数据技术开展到2015年时,业界的关注焦点转向了机器学习,希望应用散布式计算才能,来处理机器学习算法,尤其是神经网络算法的计算才能成绩,使之可以完成高密集的迭代计算,从而进步算法精度。记得2015年我去参与纽约的Hadoop World大会,事先就发现短短一年中降生了近50家机器学习的创业公司,在提供散布式机器学习的产品或效劳。计算框架也发生了分歧,Spark事先擅长统计机器学习,而Google事先刚刚开源的单机版Tensorflow则擅长深度学习。同时深度学习算法上的打破,使得过来多个使用范畴,包括计算机视觉、自然言语处置、语音交互、传统机器学习、机器人等过来隔得很远的范畴,都能被一致成采用一类深度学习算法,都能高效地失掉处置,并且可以随便地超越过来各自范畴积聚多年的算法。如今开源的人脸辨认算法都可以到达98%的精度,运用深度学习算法,可以比拟容易地在ImageNet的竞赛中失掉前几名。充沛阐明了深度学习算法曾经成熟。

星环科技孙元浩:2018年人工智能技术三大发展方向

但是深度学习算法的特性,要求弱小的计算才能和少量的样本数据。这两个是深度学习算法普遍使用的两大阻力。处理计算才能的方案之一是采用AI已经渗透到了生活中的方方面面。在智能交通领域,人工智能技术也正在发挥作用。散布式计算,因而降生了十多种深度学习的计算框架,例如Tensorflow,Caffe,MxNet等等;方案之二,也有一些公司设计专门的硬件,例如Google TPU,国际的地平线/深鉴科技/寒武纪等,有的将深度学习算法写入到FPGA中,有的设计带特定指令集的处置器,来减速深度学习算法的运转。同时为了进步算法的精度,需求少量的标注数据,因而很多人工智能创业公司都雇佣或外包上百人的团队给他们做数据标注。虽说是妨碍,这也是深度学习算法的一个宏大的优势,由于增大数据量就可以进步算法精度,这是传统机器学习算法做不到的。因而对拥有少量样本数据的公司来说,由于曾经积聚的多年的数据,就容易构成行业壁垒,其他公司,即便是大公司也很难进入与其竞争。

我们在实践使用深度学习算法的进程中发现,随着使用场景的变化,需求重新训练算法来失掉适宜的模型。我们在车牌辨认和买卖婚配使用中,发现即便是拥有优秀人工智能迷信家的归国创业团队,跟我们也在同一个起跑线上,也需求重头开端重新训练模型。我们应用现有的客户资源和数据优势,从现场视频中制造了几十万张样本,经过样本的采集和算法的优化,使得我们的车牌/车型算法精度远超越了业界知名的公司。

星环从创业之初就开端在机器学习方面停止投入,2015年终也推出了Discover开发工具。Discover产品推出后被几百位客户运用过,积聚了少量的经历。但是一方面事先的市场没有这么热,事先的客户依然觉得机器学习无法发扬真正的价值;另一方面,我们选择了提供编程言语和开发工具的方式,这使得我们产品的受众面比拟窄,只要高端的数据迷信家才会运用这类产品。

进入2018年,我以为AI有三个开展趋向:

1.AI in Production. AI从一门迷信开端转变成一个零碎或产品,一句话,AI需求产品化,也必将产品化。随着机器学习和深度学习算法的不时成熟,需求将AI来打形成产品和零碎,并在各个范畴寻觅Killer Applications。但是深度学习依然面临着很大应战,需求少量计算才能(需求少量CPU, GPU,FPGA/ASIC的混算计算才能,以及散布式计算才能),需求少量样本和数据,甚至需求少量人工来制造样本(以传递知识给机器)。 这就是为什么Google的首席迷信家Jeaf Dean最近召集了一个新的会议,叫做SysML (System and Machine Learning,www.sysml.cc), 试图寻觅计算零碎和机器学习的结合点,来找到机器学习零碎的最佳完成方式,以及开发新的机器学习算法。这个会议的第一个受邀演讲,是引见如何经过编译器技术,将机器学习算法的算子,编译到不同的后端(CPU,GPU,FPGA等)上高效执行。这是区别于设计专有硬件的一个零碎性办法,这个办法具有更好的灵敏性,因而备受关注。

2.AI for everyone. 机器学习工具需求愈加易用化,更普及,让更多普通人可以运用。目前的一个重要趋向,是运用深度学习技术,来提升AI工具的智能化水平,包括自动建模,自动寻觅最优参数,特征工程半自动化等等,使得整个机器学习进程愈加智能化/自动化。一切的机器学习工具厂商都开端往这个方向努力,例如DataRobot不断在宣传自动建模(Auto-Modeling)的优势。Google的Li Feifei团队发布的AutoML,使得普通人都可以用这个工具来创立计算机视觉相关的使用。

3.AI in everywhere.AI算法虽然中心,但只是整个零碎的一局部,自身不能构成独立的产品,更多地需求将算法使用到各个使用范畴中,赋能各个行业,以发扬算法的价值。在2018年,我置信各个行业,各个范畴,都在积极地做一些尝试,应用AI来赋能已有的产品或使用,以进步现有产品或效劳的智能化程度。自动驾驶是个典型的运用AI提升 汽车 智能程度的例子。

2018年已来,让我们振奋肉体,为AI的将来做好充足的预备。