农企新闻网

人脸辨认的新世界——卡通人脸检测

发布者:李楠
导读大众号:将门创投整理编译:T.R人脸辨认作为深度学习最具代表性的技术之一,近年来失掉了飞速的开展,无论是在精度、速度和规模上都有了极大的进步。在获得如此宏大成功的同时,迷信家们将目光转向了一个尚未充沛探究的范畴——卡通人脸辨认,行将卡通动画作品中的人脸停止精确的检测和辨认。随着数字技术和新媒体技术的疾速开展我们的生活中呈现了越来越多的卡通化人物,它们不只成为了孩子们看法世界的窗口,更提供了教学辅佐

大众号:将门创投

整理编译:T.R

人脸辨认作为深度学习最具代表性的技术之一,近年来失掉了飞速的开展,无论是在精度、速度和规模上都有了极大的进步。在获得如此宏大成功的同时,迷信家们将目光转向了一个尚未充沛探究的范畴——卡通人脸辨认,行将卡通动画作品中的人脸停止精确的检测和辨认。

人脸识别的新世界——卡通人脸检测

随着数字技术和新媒体技术的疾速开展我们的生活中呈现了越来越多的卡通化人物,它们不只成为了孩子们看法世界的窗口,更提供了教学辅佐和科研传达的功用,甚至用于描绘团体观念甚至传达社会思想。与规范的绘画作品相比,卡通、漫画、幽默作品以一种非常夸大的方式来表现,并招致了人脸的大幅形变和特征转移。关于卡通人脸的检测在动画行业中的需求也日渐添加,次要包括:经过图像搜索引擎在网络中搜索类似的卡通图像;经过辨认和语音分解协助视觉妨碍看法享用卡通电影的乐趣;同时还能作为内容控制和审查软件的一局部来对社交媒体的内容停止处置。

为了完成这一目的,研讨人员们应用了IIIT-CFW卡通数据集作为燃料,基于深度学习完成了卡通人脸检测、辨认任务,并超越了传统的办法到达了优秀的检测效果。

人脸识别的新世界——卡通人脸检测

这一数据集中包括了8928张带标志的卡通人脸图像,其中不只包括了不同年龄、性别、情感的根本人脸数据,同时还包括各团体种、人脸地位以及挖苦隐喻等高维度信息,其标注信息示例如下,包括了七个特征维度和包括角色名字的五团体脸地位维度信息:

人脸识别的新世界——卡通人脸检测
Face Annotation

作者关于卡通人脸次要停止了三个方面的任务:人脸检测、人脸辨认和性别检测,并在检测的进程中对卡通人脸的关键点停止了辨认和抽取。

关于人脸检测,研讨人员们次要运用了MTCNN(Multi-task Cascaded Convolutional Network)网络,这一架构包括三个次要的局部辨别是经过图像金字塔提出候选框的建议网络P-Net、随后是用于提炼优化后果的精炼网络R-Net,最初是用于生成最终人脸框和五个标志后果的输入网络O-Net。

人脸识别的新世界——卡通人脸检测

关于人脸辨认任务,研讨人员们提出两种方式,第一种是应用Inceptionv3+SVM来停止辨认,首先应用Inception来高效抽取图像特征,并在最初运用分类器来对最终2048维后果停止分类完成辨认。

人脸识别的新世界——卡通人脸检测

另一种方式应用了建议零碎来构建了标志抽取零碎,并基于多输出多输入的CNN分类器完成了人脸辨认。首先将卡通图像停止灰度和归一化处置,随后对卡通人脸图像的15个特征点坐标停止抽取。在检测进程中,运用了5层的神经网络对特征点停止检测(应用真实的人脸停止了训练,以进步人脸特征检测才能)。最初这一后果和像素处置的后果同时送入到建议人脸辨认架构网络中去,经过CNN的多输出多输入后果停止辨认。

人脸识别的新世界——卡通人脸检测

经过关于上述网络的训练后,失掉了良好的检测后果。在人脸检测的表现上,作者同时和基于HOG特征及Harr特征的后果停止了比拟,在真阳性、假阳性、假阴性的目标都超越了这些办法。

人脸识别的新世界——卡通人脸检测

在卡通人脸关键点提取义务中也表现良好。

人脸识别的新世界——卡通人脸检测

这一任务的次要奉献在于应用MTCNN架构完成了卡通人脸的检测,并在多个目标上有了较大的进步,同时在卡通人脸辨认义务上应用了预训练的Inception架构和SVM特征分类器完成了更高的效果。并提出了基于LeNet的多输出多输入HCNN架构降低了top5的错误率。

值得一提的是,在卡通图像范畴还有很多的任务可以去填坑,包括卡通人脸辨认、验证、性别辨认,照片到卡通图像的互相转换(相似作风迁移)、卡通人脸检测、地位估量和关键点检测、相关特性辨认以及基于卡通图像特征的搜索引擎。同时还包括经过照片转化为一系列卡通表情的生成、草图绘制和渲染,以及相应的逆成绩。还有很多使用和点可以再卡通范畴停止探究,甚至GANs和VAE也是一个不错的选择呢!

假如你想上手尝试下你喜欢的二次元角色的话,可以参考上面的材料:
一个已经的demo:https://github.com/nagadomi/animeface-2009
paper:https://arxiv.org/pdf/1804.01753.pdf
database:https://link.springer.com/chapter/10.1007/978-3-319-46604-0_3
还有一些其他的人脸database:http://web.mit.edu/emeyers/www/face_databases.html

-The End-