远鉴科技: 这一次,我们提升了10%的正确通过率

互联网
2019
04/15
17:53
分享
评论

2017年以来,各大手机厂商将人脸识别推广到了大众消费者的视野之下,这项技术一时间风生水起。随着近年来大数据和深度学习等相关技术的发展,人脸识别效果有了突飞猛进的提高,在身份认证、视频监控、美颜娱乐等场景应用也愈加广泛。

而人脸识别中的人证比对,由于其应用的普适性和实用性,正得到越来越多的关注。但由于人证比对问题的特殊性,其他场景下工作良好的人脸识别模型在该场景中往往准确率急剧下降。究其原因,主要有以下两方面的挑战:

一方面,与学术界关注的标准数据库中人脸分类不同,人证比对模型训练过程中证件照与生活照数量严重失衡。证件照在公开场景一般较为稀缺,而手工收集大量匹配的生活照和证件照成本较高。如何在失衡数据集中应用已有深度学习方法成为了核心问题之一。

另一方面,生活照与证件照拍摄场景具有显著差异。由于获取渠道的问题,证件照往往面临有损压缩过程带来的严重质量下降。此外生活照的角度、阳光、不同表情等因素也会影响生活照与标准证件照的比对效果。

针对上述问题,远鉴科技创新性地提出了一种针对于人证比对场景的人脸识别方案,可以在训练数据中证件照数目较少的情况下,较大幅度地提高人脸识别引擎对生活照与证件照的比对能力。

人脸识别算法中,训练模型的损失函数选取至关重要。早期工作中,研究者直接选用泛用的Softmax loss作为优化目标来处理人脸分类问题。在后续工作中,研究者发现基于角度空间的损失函数相对于欧氏距离,可以使训练过程的相似度度量和测试时保持一致,具有更加良好的可解释性,提出了CosFace、ArcFace等方法,进一步加强了分类损失函数的约束效果,在公开人脸生活照数据集中取得了良好的成绩。

在上述研究基础上,远鉴科技针对人证比对的这一特定应用场景,于损失函数层次对生活照和证件照进一步区分,改进了目前损失函数的构成,构造出了一种更适合人证比对场景的损失函数。

在模型训练过程中,神经网络模型可以分为特征网络和分类网络两部分。特征网络用于将输入的人脸图像转化为固定长度的特征描述,而分类网络用于判断该特征属于哪个训练人脸类别。远鉴科技将特征网络的权重在每个训练周期中通过梯度下降法进行更新,而分类网络的权重不通过梯度下降法进行更新,而是直接由本周期中相应类别的证件照归一化特征进行替换。通过这样的方法,我们可以让特征网络更容易学习到同身份在生活照和证件照这样不同场景下图像的内在关联信息,同时更加关注同场景不同身份的差异信息。从而在不经过大规模证件照训练的情况下,进一步提升模型在人证比对任务中的性能。

在大规模人证比对数据集上进行了实验后,远鉴科技将本发明方法与业界领先的人脸识别方法NormFace、CosFace比较,结果有了大幅度的性能提升:千分之一误报率时,远鉴科技发明的方法的正确通过率分别提升了9.2%和12.2%;在万分之一误报率时,正确通过率分别提升了5.6%和11.3%。甚至在传统生活照比对场景上,该方法性能也有了令人欣喜的提升。

现实生活中的很多场景都会应用到人证比对,一个高准确率的实时自动人证比对系统可以大幅度提升用户体验度,并应用于更广泛的场景。立足技术,扎根场景,拓宽应用。远鉴科技将会继续利用自身的技术优势,驱动整个AI研究更快发展和落地。

THE END
广告、内容合作请点击这里 寻求合作
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表砍柴网的观点和立场。

相关热点

相关推荐

1
3