雷锋网 AI 科技评论按:2018 年 4 月 14 日-15 日,中国图象图形学学会围绕「生物特征辨认」这一主题,在中科院自动化所成功举行了第四期「CSIG 图像图形学科前沿讲习班」。
生物特征辨认(BIOMETRICS),是指经过计算机应用人体所固有的生理特征(指纹、虹膜、面相、DNA等)或行为特征(步态、击键习气等)来停止团体身份鉴定的技术。
本期讲习班约请有旷视科技首席迷信家孙剑,中科院研讨员孙哲南、山世光、赫然、王亮,清华副教授冯建江、徐明星,中山大学教授郑伟诗等八位学者辨别就人脸、虹膜、指纹、步态、音纹等人体特征的研讨现状做了详细报告。
雷锋网 (大众号:雷锋网) 在本文中将对 14 日孙剑、孙哲南、赫然、冯建江的 4 场精彩报告停止引见。15 日的精彩报告见下篇文章。
孙剑:慧眼识人,让机器像人一样看懂人
旷视科技的首席迷信家、旷视研讨院院长孙剑做了首场报告,在一个多小时的工夫里孙剑次要引见了他在视觉范畴的一些中心任务。
孙剑博士在报告中引见道他们计算机视觉的次要义务是了解图片,发掘图片中的价值,例如人脸、举措、文字等。他将本人在视觉范畴的中心任务分为分类检测、联系学习、区分学习,对图像层、区域层和像素层的辨认。同时,他也引见了图像辨认的开展进程。
最早做图像辨认的办法是建模——数学复杂建模或许基于统计的建模。之后引入了学习的办法,但由于事先计算才能很弱,这种办法下的自然图像辨认效果并不好。再然后就有了 Feature based 的办法,首先提取图像的各种特征停止量化,最初再做一个分类器停止辨认或许特征提取。这个办法关于辨认功能的提升并不高,优化很困难,所以并不被事先的研讨者看好。
2006 年时呈现了一些新变化,神经网络训练在语音辨认范畴表现比拟好,然后在图像范畴也获得了一些打破性的停顿。但优化困难、训练错误的成绩还是存在。直至 2015 年,孙剑博士团队在微软研收回 resnet,可以直接训练上百层的网络,同时极大地降低了训练错误率。孙剑博士复杂概括 resnet 的原理是在零碎十分深、层数比拟多时停止变换,一是直接学习变换,二是学习残差信号。其中残差网络更容易优化。
以上是辨认成绩,孙剑博士还提到一个比拟重要的成绩——检测成绩。伯克利的博士后罗斯在这个范畴上做出了打破性任务,他运用地位分类,运用地位框将物体框出来,这个办法将检测功能提升了很多倍,目前运用普遍。罗斯为优化检测成绩进一步提出将 feature 归入学习的办法,孙建博士团队提出了 Faster-RCNN 处理该办法遇到的计算量成绩。以后 Faster-RCNN 也是大家普遍运用的办法。
孙剑博士补充道在使用方面,无论是安防还是批发,跨摄像头追踪都是一项比拟重要的任务。为了让他们团队的 ReID 模型正确的学习,他们引入了静态规划的办法。这种办法表现出的效果很好,甚至可以超越人。同时该办法也适用于联系成绩。
孙剑博士以为研讨生物辨认还有一个比拟重要的成绩是研讨如何在不同的环境中设计网络。这里他引见的他们的另一项任务 ShuffleNet。这项任务曾经被使用到手机的人脸辨认和 AI 相机等功用下面。AI 相机的自动调焦、曝光等功用充沛证明了 ShuffleNet 即便是在手机的计算才能下也可以表现的很好。
报告最初孙剑博士引见本人的研讨方向是认知智能,之后会着力提升模型的推行才能。
孙哲南:虹膜辨认研讨停顿与开展趋向
接着中科院自动化所研讨员孙哲南做了关于虹膜辨认的报告。
孙哲南研讨员引见了虹膜辨认的概念。虹膜是黑色瞳孔和白色鼓膜之间的区域,虹膜的尺寸比拟小但信息量十分的大。由于虹膜不具有基因遗传性,容易遭到发育环境的影响。且虹膜在发育到一定阶段后十分波动,所以虹膜的纹理具有很强的独一性。
接着他引见了虹膜辨认的特殊优势,首先就是很高的独一性,其次就是运用的普遍性。在超大规模人群中,虹膜辨认具有共同的优势,因而在门禁、机场、边检口岸等有普遍的使用,目前最大的虹膜辨认使用当属印度的身份证零碎。印度的 UID 项目曾经采集了 12 亿的虹膜特征,经过大规模的使用测试,现实证明虹膜辨认精度很高,且辨认速度很快。
整个虹膜辨认的规范流程包括三个。第一是采集,第二是预处置,第三是剖析与比照。其中采集局部需求用到光学等模块包括镜红外自动光,需求 CCD 和 CMOS,还需求人机交互模块以及视觉反应模块。在虹膜采集进程中他们普通采用多模态的生物特征辨认,包括人脸,这样可以停止多模态的身份验证。
虹膜获取之后就是预处置环节。预处置的第一步是虹膜的检测,检测次要是确定虹膜的地位,以及虹膜准确的边界。预处置的第二步是活体虹膜的检测,次要是避免虹膜造假。孙哲南团队为此提出了一个层次化的分类办法,这种办法在人种分类、活体分类以及数据库检索方面表现良好。第三步是虹膜质量评价。最初虹膜预处置还需处理虹膜纹理的非线性缩变。
预处置完毕就可以停止虹膜图像特征的提取与比对。关于目的特征的提取和辨认,孙哲南团队提出了质量测量特征。为理解决提取噪声成绩,他们提出了定性变量的办法,提取之后的比照成绩上,他们采用基于全衔接的衔接的办法,一举处理了深度神经网络比对速度慢的成绩
在引见完技术后,孙哲南研讨员将虹膜辨认的开展历史概括为如下七个阶段:
-
一:近间隔,人不动,人配合机器
-
二:人不动,自动配合
-
三:人不动,远间隔辨认
-
四:间隔远,但机器配合人
-
五:人挪动也能辨认
-
六:挪动中自动抓拍辨认
-
七:监控场景多摄像头抓拍辨认
孙哲南研讨员总结到如今运用深度学习的办法可以在联系、属性剖析、辨认等方面失掉愈加准确的后果。但是还有很多技术难题需求攻克,比方一次辨认多个虹膜等。
赫然:大规模人脸图像编辑实际、办法及使用
赫然研讨员在下午做了人脸图像编辑的报告。
人脸图像编辑即是经过机器对图像停止处置失掉一些新的图像。这项技术目前在日常生活中拥有普遍的使用,如照片丑化等。
人脸编辑触及光谱变换、属性迁移、年龄变换、图像生成等方面的内容。实际根底触及全光人脸剖析、视觉拓扑优先、生成对立构造、身份坚持构造等。人脸采集会使用到全光函数,赫然研讨员引见道人脸编辑的目的是契合人的视觉认知,人类视觉认知触及拓扑感知机制。
至于图片生成算法的最根本的理念则是对话生成网络,其中最根本的概念就是 GAN。这个模型分为生成式模型和判别式模型。经过生成器与判别器的博弈来生成尽量真实的图像。
在生成器生成进程中触及到身份坚持的成绩,即生成男性图像不会变为女性。赫然研讨员采用定距度量的方式,同时自创了神经学中的侧向抑制来处理该成绩。
目前赫然研讨员的任务开放了两个版本,一个是 LightCNN9伴随着互联网和移动生活的日趋成熟,芝麻信用高分和良好的个人征信记录,不仅可以办理贷款、申请信用卡延伸你的财富,更能大大便利我们的生活。,另一个是 LightCNN29。这两个都是通用模型,且在一切地下数据中都获得了最好的后果。
接上去赫然研讨员引见了他们研讨中心的相关任务,包括超分辨率、视角旋转、上妆去妆、表情编辑、年龄变换、像素补充、跨光谱分解等。
赫然研讨员总结他们的任务,首先是人脸分解,这是人脸剖析外面比拟重要的一局部,而人脸生成的目的是契合人的视觉认知。他们会在接上去的任务中力图越来越精确。
冯建江:指纹辨认现状与研讨停顿
冯建江教授接着做了指纹辨认的报告。他表示,指纹的独一性和波动性十分好。随着年龄的增长只会有些许变化,很合适用作辨认。
首先指纹辨认外面有三个模块——图像采集、特征提取和婚配。指纹采集分两种,晚期的离线采集即油墨采集,如今的在线采集即光学采集等。指纹特征的提取分为两级,先提取第一级特征,在第一级特征的指引下提取第二级特征。在婚配阶段停止一个带方向的细节点婚配。
冯建江教授强调目前指纹辨认的难题有低质量指纹辨认率太低、大数据库下辨认率和效率需求进步、实际极限不清楚、伪指纹难辨认、模板不平安等。
冯建江教授着重引见了低质量指纹的辨认成绩。他们采取了指纹字典的办法,用高质量指纹训练字典。训练出的字典外面有各种指纹脊线真实的方向场。在处置蹩脚指纹的时分经过字典来选择候选方向场,然后比照延续性来选出质量比拟好的方向场。这是全局字典。全局字典的害处是容易在部分呈现不能够图案,于是冯建江教授又提出了部分字典。先经过全局字典生成指纹,再用部分字典停止修正。
指纹采集后就是细节点的提取以及歪曲场估量,歪曲场估量用来处置同一团体不同形态指纹的差别成绩。冯建江教师在歪曲场估量中一个比拟重要的任务是稀疏配置。
报告的最初冯建江教授表示运用深度学的办法来研讨指纹辨认,在低质量指纹辨认上较过来的传统办法在功能上有了分明改善。
孙剑、孙哲南、赫然、冯建江的 4 场精彩报告引见如上,敬请等待雷锋网AI 科技评论的后续报道。
。