阅历了 2016 、2017 上半年的疯狂炒作之后,人工智能的热潮正在褪去。
究其缘由,假如依照 Gartner 的「炒作曲线」来解释,则是由于新技术迸发时的大众热度更容易被媒体、资本所捕获,而随着技术落地进程中暴显露的一系列实践困难,会局部水平上招致大众的失望,从而让这项新技术逐渐淡出大众视野。
人工智能也是如此。在过来的 2017 年,围绕人工智能的场景使用正在成为国际外巨头、创业新贵押注的焦点,但是不论是图像、语音还是自然言语交互,虽然单项技术都不同水平地取得宏大开展,但尚缺乏以与实践场景结合,构成全新的传达热点,一个明显的案例,AlphaGo 在 2017 年乌镇横扫中国围棋高手的旧事远远不及单挑李世石那样吸引全球关注。
另一个缘由,则是更多新技术、新概念的呈现,这在中国的表现尤为分明。2017 下半年,特别是 2017 年年底,区块链成为中国互联网行业的「新技术」,这种由虚拟货币所推进的技术简直「霎时」占据了投资人、主流科技媒体、各种自媒体的讨论议题里。
上述两个缘由或多或少让人工智能暂时摆脱了聚光灯的关注,也让我们有更多的感性去对待这个过来几年被誉为「改动人类命运」的技术,究竟是一次面向远方伟大征程的开端,还是又一次从寒冬到盛夏再到寒冬的长久更替。
人工智能的远方仍然令人向往
现实上,关于人工智能的「远方景色」曾经被反复了六十多年。自 1956 年「人工智能」一词离开这个星球上,一代代的数学家、计算机迷信家都在为之不懈努力,但究竟何为「人工智能」却存在太多了解角度。
作为达特茅斯会议组织者之一的约翰·麦卡锡,不断以为「人工智能」一词除了是暗示机器可以去完成人类可以完成的任务之外,和人类行为毫有关系。
而与麦卡锡专注数学逻辑模仿人类大脑的做法不同,另一位达特茅斯的参会者马文·明斯基则早早看到了神经网络的重要性,但颇具挖苦意味的是,也正是明斯基在某种水平上否认了神经网络的可行性,招致基于人工神经网络的研讨临时扫除在人工智能「主流」研讨之外。
而就在麦卡锡分开 MIT,扛起斯坦福大学人工智能研讨大旗之时,道格拉斯·恩格尔巴特正在努力将另一种「智能」带入计算机行业。
这位北欧人的后嗣并没有麦卡锡的「远大志向」,而是在考虑如何将技术去「提升」人类现有的技艺,他终其终身都在研讨计算机技术至于人类的意义,成为人机交互的「一代宗师」。
在硅谷资深记者约翰·马尔科夫的《与机器人共舞》中,记载了麦卡锡的「人工智能」与恩格尔巴特的「加强智能」之间的恩怨情仇,「在曾经过来的50年中,麦卡锡和恩格尔巴特的实际依然步调一致,他们最为中心的抵触依然悬而未决。一种办法要用日益弱小的计算机硬件和软件组合取代人类;另一种办法则要运用相反的工具,在脑力、经济、社会等方面拓展人类的才能。」
如今,这两种理念在全世界范围内仍然有不少支持者。伊隆·马斯克与马克·扎卡伯格口水战,霍金的末日预言与凯文·凯利的批判一度成为 2017 年各大科技媒体争先报道的音讯,但这一切讨论却扫除了这个范畴最有发言权的一线研讨者,无论是 Facebook 人工智能实验室担任人 Yan Lecun 还是深度神经网络「教父」般的 Hinton,其冷静而客观的剖析,都无法进入群众视野。
另一方面,掌握宏大传达资源的巨头公司则在塑造一个被技术赋能的美妙将来。
过来的两年,亚马逊、Google、阿里巴巴等让人工智能走入越来越多的家庭,经过语音交互的智能音箱,语音辨认、自然言语处置等技术逐渐落地,还让越来越多的用户感遭到人工智能的威力;百度、英特尔、Google 还在不时向大众传达自动驾驶的美妙将来,那些制造精良又充溢将来感的视频不时刷新着大众关于驾驶的一切想象力;一场场科技峰会/发布会上,人工智能正在进入不同行业,它可以让你的手机拍照更美观,它能够是医院医生的助手,它也可以在工厂里为提升产能奉献本人的才能,还会扮演着城市公共平安捍卫者的角色......
就这样,这两年内,大众在「人工智能如何帮xxx」的话术中开启新的一天,又在「人工智能将彻底推翻XXX」的描绘中入睡,每隔若干个小时,就有一个新行业被人工智能所改动,每隔若干天,就有一家人工智能创业公司拿了上亿美金的融资,每隔若干月,「自动驾驶行将上路」、「虚拟女冤家」的音讯再反复一次。
但是,这一切事关远方的描绘,无论是马斯克的人类末日场景还是扎克伯格的乌托邦世界,都跳过了这个行业如今的「苟且」。
当下的苟且:软件、硬件与使用
坦白来说,上文中一切关于「人工智能」提高的说法,都应该换成「深度神经网络」,或许换句话说,过来几年所谓人工智能的提高,都来自深度神经网络的疾速开展。
但是,虽然简直全世界的计算机/互联网巨头都投入到神经网络的研讨之中,却仍然在处在一个十分初级的阶段,包括以下三个方面:
- 软件层面:被人寄予厚望的强化学习也难有打破;
- 硬件层面:群雄逐鹿;
- 使用层面:图像、语音之外还剩下什么?
先说软件层面。作为 2017 年《MIT 商业评论》评选的年度十大技术,强化学习曾在 AlphaGo 击败各路围棋高手的对弈中发扬了重要作用。强化学习的根本原理,是一种和环境交互进程的「学习」进程,这种静态的学习进程十分合适在一些没有特定规则、实时反应的场景中,比方工业机器人或自动驾驶。
这是一种令人听起来就冲动的机器学习模型,这简直也是人类学习周遭事物的方式。以驾驶为例,人类司机需求结合路况来施行调整本人的驾驶行为,当下自动驾驶零碎中,感知零碎可以被深度学习处理,而决策零碎和控制零碎,则很有能够是强化学习所能发扬作用的范畴。
但当下除了 AlphaGo 应用自动对弈停止强化学习之外,其他实践使用并不理想,缘由就在于,当这一算法面临理想社会数百个乃至几千个环境变量的应战时,这种交互进程能否从始至终地坚持相对可控还无法保证,因而,短期内,这个算法还无法真正完成使用。
其次,在硬件范畴,针对深度神经网络的竞争日益白热化。英伟达、英特尔、寒武纪、Google、华为、ARM、阿里巴巴 等公司正在紧锣密鼓地推出各种硬件产品——用于训练和运转深度神经网络的高功能、可定制的处置器。
英伟达股价两年内翻了 6 倍,英特尔不惜重金收买的 Nervana、Altera,其目的都是要在这个范畴疾速成为规范和规则的制定者。但围绕硬件开展道路以及创业途径,仍然有诸多不确定性,比方,GPU、FPGA 以及 TPU 还无法有明白的优劣好坏之分,再比方,近两年的量子计算机,又会给机器学习、深度学习带来怎样的变化?
现实上,和其他一切计算行业一样,深度神经网络硬件的最终胜者,一定是那些能提供低价同时弱小计算才能、并且能让绝大少数开发者/研讨者疾速上手的产品,但在 2018 年的如今,我们还看不到。
第三,则是深度神经网络技术落地的关键环节:使用。过来几年,围绕人工智能落地的使用实例时,无外乎有两大范畴:
- 围绕图像/视频的处置,从辨认到前期处置,最直接的案例,手机相机的美颜功用;
- 基于语音的虚拟/实体产品,从手机虚拟助理到智能音箱;
上述两大范畴的落地案例在不同行业又有不同的展示方式。在消费端,2017 年华为、苹果都在其新一代旗舰手机中参加 NPU(神经网络处置单元),就是围绕神经网络在处置图像上的才能,用一个独自的处置单元让手机完成少量拍照、图片的处置任务;国际 2017 年呈现了一股智能音箱热,其面前的技术驱动力则是语音辨认、语义了解、自然言语了解等技术的整合;而在企业端,从 AWS、Google Cloud 到阿里云,云效劳商正在将图像/视频的处置才能打包为 API,供开发者和企业调用;垂直范畴,基于图像/视频技术,让国际安防行业迎来一个史无前例的春天;也是基于图像/视频技术,医疗影像的革新正冉冉而来......
但是当我们试图寻觅上述单点技术之外的落地实例时,却会绝望地发现这能够就是故事的全部。毕竟,语音、图像/视频与文本,构成了互联网上的一切内容,整个互联网行业努力的方向,都是要让这些内容最终变成构造化的数据,完成更高效的剖析和再应用。
但是,这一切需求的降生,与其说是一种「加强智能」——技术赋能行业,倒不如说是,这是一种更实践、更功利的选择,让深度学习去处理最有能够处理的成绩,并包装为人工智能的福祉,其落脚点还是互联网公司最擅长的范畴:数据。
「数据就是石油」,这是最近两年内常常听到一种说法,2017 年一期《经济学人》文章里,有一张图表阐明了诸多成绩:
右图是公司财报会议上关于人工智能的关注水平,从 2014 年开端就是极度峻峭的增长线,而与之对应的左图里,IDC 制造的「digital universe」指代的是每年数据消费和复制的数量,其增速也是指数级的。
这至多阐明了两个成绩:其一,人工智能确实是当下最热的命题之一;其二,人工智能的再次回归,是海量数据带来的最直接反响,这也就不难了解,为何当下一切标榜「人工智能」的使用,简直都是数据密集范畴的产物了。
写在最初,逾越不能够
假如以「远方」的规范来权衡当下的「苟且」,深度神经网络远非人工智能的将来。在一个媒体效应远大于实践效应的当下,大众往往会将深度学习、机器学习、人工智能混为一谈;又或许,误以为 AlphaGo 就是深度学习的产物。
我们还在等待更好的算法,从基本上处理「黑盒子」难题,从而可以让机器决策进程变得更通明,这在当下尤为重要。Google 面临欧盟反垄断调查时的首要成绩是:为什么这个搜索后果要排在另一个后果之前?再比方,当越来越多标榜将深度学习使用到金融范畴的场景里,当用户的存款恳求被深度学习算法所采纳时,能否解释这其中的理由究竟是什么?
我们也异样需求一个没有成见的算法。 2017 年,IBM Watson 在被引入美国法院审讯时也呈现诸多争议,由于过往数据显示黑人立功比例高,招致 Watson 在决策时经常像人类法官一样做出带有成见性的决策。而在一个男权之上的社会,少量公司高管都是男性,此时假使引入深度学习作为招聘工具,则很有能够招来更多男性。
这种根深蒂固的成见简直普遍存在于一切的机器学习算法中,但很显然,深度学习最难测试与调整,同时又由于其普遍的使用场景变得愈加引人注目,微软几次三番上线在 Twitter 上线聊天机器人,又几次三番地下架,其缘由就是当一个深度学习使用顺序面临真实社会场景时,其所做作为曾经超出了使用开发者的控制,甚至都无法让其「浪子回头」,独一的做法就是下架。
你当然可以说这不是算法的成绩,而是社会环境的自然映射,可成绩的关键在于,围绕人工智能,甚至围绕机器学习,还有少量的选择余地,深度学习不应该、也没有这么大才能承当如此严重的义务,在人类迈向智能社会的伟大征程之中,我们理应有更好的工具。(本文首发钛媒体)
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或许下载钛媒体App