雷锋网 (大众号:雷锋网) AI研习社按 :计算机视觉是一门研讨如何使机器“看”的迷信,掌握处理详细计算机视觉义务的办法则会协助我们处理大规模零碎的复杂成绩,其使用相当普遍,最罕见的如人脸辨认,文字辨认等等。这篇文章就来为大家从头普及一下计算机视觉相关知识,包括计算机视觉的定义、研讨办法和使用举例,还会重点引见深度学习历史开展历史,罕见深度学习网络引见和开发平台,协助计算机视觉入门者和从业者停止无效的根底夯实和零碎梳理。
近日,在雷锋网AI研习社举行的线上直播课上,来自上海交通大学的卢宪凯博士为大家分享了计算机视觉范畴的入门知识。这也是卢博士CV系列课线上直播的第一期,前期会陆续由浅入深,为关注AI研习社的小同伴持们续产出干货,欢送订阅卢宪凯博士的收费直播课。
卢宪凯,上海交通大学博士,次要研讨方向是目的跟踪与深度学习。在多个计算机视觉期刊会议上宣布多篇学术论文,包括IEEE Transaction on Multimedia、MTA、Neurocomputing、ICASSP。
分享内容
计算机视觉定义和研讨办法
计算机视觉的使用举例:图像分类,人脸辨认;车辆检测,行人检测;语义联系,实例联系;目的跟踪,视频联系;图像生成,视频生成
深度学习历史回忆
罕见深度学习网络引见和开发平台
计算机视觉概述和深度学习简介
计算机视觉是指从图像和视频中提出数值或契合信息的计算零碎。更抽象一点讲就是说,计算机视觉是让计算机具有像人类一样的眼睛,看到图像,并了解图像。
人类的视觉首先是经过眼睛看到一幅图片,大脑来了解这个图片。关于计算机来说,就会经过摄像头或摄像机获取这张图片,然后应用计算机算法来看图片,读取信息。
计算机视觉最中心局部就是了解。第一步是提供数据,包括静态图片,视频。第二步是设计算法,让计算机像人的大脑一样了解数据,这个进程需求机器学习和算法,或许如今比拟火的神经网路深度学习的办法。计算机视觉归根结底就是做一个回归或许分类的成绩。前面讲到的大局部关于计算机视觉的义务都可以用回归或分类的成绩对它建模。
计算机视觉十分重要的使用之一就是图像分类。李飞飞创立的ImageNet数据集极大推进了计算机视觉的开展,也让大家更了解了计算机视觉对大家的生活是起着十分重要的作用。
除了图像辨认义务外,还有特定目的的辨认,比方车牌辨认,人脸辨认,还有比拟精密的辨认,年龄,性别,能否戴眼镜,表情的辨认,判别一团体能否笑了。
计算机视觉里的第二个义务——目的检测。目的检测是在给定一个图像,把我感兴味的前景目的检测出来,并添加类别。目的检测是头像辨认的进一步开展。目的检测要晓得图片中有哪些类别,还有晓得他们的地位。
行人检测和车辆检测。对人群密集处的检测,对未来能够发作的异常事情起到预警作用。左边的车辆检测,可以统计车辆个数,实时估量车流密度,这样的话关于疏解城市交通是十分有协助的。这两个是做目的检测中的两个细化使用。
计算机视觉的第三个义务联系。联系包括两种,图像语义联系和集体联系。图像语义联系是指给你一个张图片,把图中的物体联系开来。集体联系比语义联系更难,相当于在检测义务上加上了联系。
视觉目的跟踪,也有很多普遍使用。假如拓展到多目的跟踪,可使用在候机大厅或商场外面,对每团体实时跟踪,树立每一团体的轨迹,比方某人忽然和另一团体有了交互,就可判别能否在打架。
还可使用在自动驾驶下面,比方前置摄像头拍到后面的几辆车,实时跟踪,并计算出以后车与前车的间隔。
视频联系,前置摄像头拍出街景照片,可用于无人驾驶。
视频生成,有了以后帧可以预测下一帧,再结合摄像头失掉下一帧的样子。可以增加计算资源耗费。
深度学习简介
这几年计算机视觉曾经和深度学习变得密不可分。计算机视觉研讨曾经有很多风趣使用,比方图像作风迁移。
生成对立网络(GAN)的风趣使用,比方可以将女性脸庞逐步演化为男性脸庞。
直播换脸的使用
大多数人都曾因不佳的交通状况而迟过到、叫过苦。经济的快速发展带动的是社会各方面的全面提升,但在此过程中,交通的发展却没跟得上前进的步幅,各类交通难题让交管部门伤透脑筋,如何利用AI来解决相关难题已成当务之急。
深度学习在人脸辨认的使用。目前应用深度学习在LFW数据库训练人脸辨认,错误率5%下降到0.5%
前期的课程会详细引见这几个网络VGGNet, GoogLeNet ,ResNet ,DenseNet。
罕见的深度学习开发平台
以上是计算机视觉零碎课程的第一课,复杂引见了一下计算机视觉的图像辨认,目的检测,图像和视频联系,目的追踪,图像和视频生成的一些罕见使用,接上去卢宪凯博士还会结合深度学习解说完成这些义务需求的算法,模型以及实战使用。下一次直播课程是深度卷积网络的原理及模型引见,以及如何搭建和训练一个深度学习网络。
雷锋网提示:如想在第一工夫获取课程直播预告工夫,请关注微信大众号:AI研习社。
。