源 | 大数据每日评论
编译 | 大数据每日评论-陈志扬、刘恒
计算机视觉:
自20世纪50年第一台“会考虑的机器”在一间地下室降生开端,教计算机如何去“看”就不断是研讨者所追求的目的。但是,计算机视觉的真正开展应该追溯到人们初次用金属板捕捉光线,并且贯串数字反动和当下的人工智能(AI)浪潮。从人脸辨认到无人驾驶,计算机视觉的开展影响了我们身边的一切,而关于它的事情,我们还得从这里说起——
银板照相(1839)
1839年1月的一次巴黎沙龙上,Louis-Jacques-Mandé Daguerre经过展现一种永世捕捉图像的办法——银板照相法,成功地震惊了整个法国迷信院。银板照相法是将涂有碘化银的铜片暴露在光线下,然后经过汞蒸汽和食盐溶液来显影。哇哦,照相机降生了!
胶卷的创造 (1888)
1888年,George Eastman创建了柯达——一种带有固定透镜的复杂盒式相机。这项创造最重要的创新点是:它将图像存储在了胶片而不是金属板上。相机的一切者一次能拍摄多达100张图片,但是在这之后便需求将设备送回工厂处置图片以及重装相机。
即显摄影 (1947)
1947年2月,Edwin Land发布“宝丽来95型”相机之后,急迫的“快门”喜好者再也不需求花工夫等候照片处置。20世纪80年代末第一台商业数码相机呈现以前,宝丽来相机一直是可以获取图像的最快工具。Outkast的歌曲《Hey Ya!》中的“shake it like a Polaroid picture”作为一个短语至今仍被人们普遍运用。
AI的提出 (1956)
19世纪50年代中期,几位出色的迷信家Marvin Minsky、Claude Shannon、John McCarthy和Nathaniel Rochester提议在达特茅斯停止为期两个月的冬季项目研讨“如何使机用具有言语和笼统思想才能,处理人类目前无法处理的成绩并自我提升”。据记载这是“人工智能”这个词有第一次被正式提出。
像素的降生 (1957)
1957年春天,美国国度规范局的迷信家Russell Kirsch为他的儿子Walden拍了一张照,并将其扫描到了东部规范自动计算机(SEAC)中。为了使图片可以放进SEAC无限的存储空间中,他将图片联系成176176的网格——共30976位二进制,并停止了屡次扫描。这张边长5厘米的正方形图片就是历史上第一张数字图像,从某种意义下去讲它甚至是CT扫描、卫星图像和数码摄影的鼻祖。
三维世界的积木 (1963)
1963年五月,MIT研讨生Larry Roberts提交了一份关于机器如何经过二维图像感知三维物体的博士论文。Roberts提出的“积木世界”实际为日后的计算机视觉开展打下了根底。他之后持续监视阿帕网——当今互联网的先驱。
“冬季视觉项目”(1966)
第一次AI热潮的十年后,MIT教授Seymour Papert给他的先生一项暑期作业开发一个视觉零碎,将图片分类为“能够是物体,能够是背景区域,和混乱有意义的”三局部。这便是人工智能在形式辨认方面的第一次使用。
CCD的创造 (1969)
1969年秋天,大约是阿帕网正式启动的时分,贝尔实验室的两位迷信家Willard S. Boyle和George E. Smith正忙于电荷耦合器件(CCD)的研发。CCD,一种将光子转化为电脉冲的器件,很快成为了高质量数字图像采集义务的新宠。他们还因这项任务在2009年10月而被授予诺贝尔物理学奖。
第一台数码相机 (1975)
1975年12月,柯达公司工程师Steven Sasson发明性天时用Super 8摄像机的废弃零件、一个电压表、一个100100像素的精密CCD本着网络面前人人平等的原则,提倡所有人共同协作,编写一部完整而完善的百科全书,让知识在一定的技术规则和文化脉络下得以不断组合和拓展。 以及六块电路板,制造出了世界上第一台数码相机。这个八磅重的相机花了23秒来拍摄一张百万像素级的彩色图像。拍摄上去的图片被记载在盒式磁带上,并可以在彩色电视机上显示。
卷积神经网络(20世纪80年代)
植物视觉皮层通常同时运用复杂和复杂的脑细胞处置图像,受此启示,卷积神经网络(CNN)应用多层神经元叠加来辨认和区别不同的形式。其中比拟著名的是Kunihiko Fukushima的神经认知机和Yann LeCun的LeNet。如今,卷积神经网络曾经是图像、语音和手写辨认零碎中的重要组成局部。
DARPA超级应战赛 (2005)
2005年10月第一辆依托计算机视觉辨认地貌特征并避开妨碍的全自动驾驶汽车在内华达沙漠完成了132英里的长途跋涉,并取得了由DARPA提供的200万美元奖金。获奖车辆由斯坦福大学的一支队伍建造,仅用了6小时53分钟就在严酷的环境中完成了义务。
神经网络,在游戏中开展 (2005)
训练神经网络一向是一项资源密集且极端迟缓的任务,这一情况直到2005年才有所改善。微软的Dave Steinkraus、Patrice Simard,以及英伟达的Ian Buck在论文中描绘了如何运用游戏主机中现成的图像处置单元(GPU)来训练神经网络。自此之后,训练的速度和精确率有了大幅度的提升,训练本钱也有所降低。
生成对立网络的碰撞 (2014)
2014年,蒙特利尔大学的一个研讨团队提出了一个观念:拥有两个互相竞争的神经网络可以使机器学习得更快。一个网络尝试模拟真实数据生成假的数据,而另一个网络则试图将假数据区分出来。随着工夫的推移,两个网络都会失掉训练:生成器可以生成能以假乱真的数据。生成对立网络(GAN)被以为是计算机视觉范畴的下一个严重打破。
机器VS人 1:0 (2015)
从2010年开端,ImageNet大规模视觉辨认应战赛让人与计算机在辨认图片方面停止着临时的比赛。2015年,机器获得了成功,谷歌和微软构建的神经网络相较于人类有着更低的错误率。大约同时,Facebook也宣称其DeepFace人脸辨认算法有着97.35%的辨认精确率,简直与人类不分上下。从此当前,还有谁需求强大的人类呢?
有“眼睛”的亚马逊无人机(2016)
作为亚马逊无人驾驶自主运输零碎的一局部,这个网络批发行业的巨头正方案为它的Prime Air无人机加上辨认妨碍和着陆区域的才能。借用计算机视觉方面相关知识,亚马逊希望它的无人机可以区分草地和游泳池,或是一棵真实的树和其在窗户中的倒影。
自动驾驶汽车上路 (2017)
沃尔沃宣布往年将在瑞典哥德堡投放100辆具有自动驾驶功用的XC90轿车。Drive Me项目是沃尔沃为在2021年向顾客出售全自动驾驶汽车而方案的下一步。福特也泄漏了将于2017年在欧洲对100辆自动驾驶汽车停止路途测试。通用汽车、宝马和谷歌旗下的Waymo都加大了关于视觉制导汽车的测试力度,埃隆·马斯克宣布,一辆搭载自动驾驶仪的特斯拉会在2017年底之前从洛杉矶开往纽约。
联邦调查局:人脑辨认引发的“血案” (2017)
三月的美国国会听证会将FBI的人脸辨认数据库推到了言论的风口浪尖之上。众议院政府监视和变革委员会的成员发现,FBI未能就包括大约50%的美国公民的图像数据库对团体隐私的影响停止评价。同时,这个数据库被发现有严重的数据偏向和种族歧视。委员会呼吁应该对这些数据的搜集和运用有更严厉的监管力度。