- 01/03
- 2018
-
QQ扫一扫
-
Vision小助手
(CMVU)
人脸识别、图像分类、语音识别是最早的深度学习取得突破的主要几个技术方向。在2014年前后,多家技术公司纷纷宣布其利用深度学习在LFW上取得的最新成果,此为深度学习技术在人脸识别领域的“小试牛刀”。随后,商汤、Face++等国内的多家技术公司针对金融行业人脸认证这一需求持续改进算法,随着PK的不断升级,人脸认证图像相对可控下的人脸识别性能不断被刷新,固定识别通过率为90%,识别误匹配率指标被降低了好几个数量级,此为深度学习技术在人脸识别领域的“硕果初尝”。类似的技术被用在了手机APP的人脸登录、相册管理等,这里不一一赘述。
而当下,人脸识别的挑战焦点重新回到了安防行业的应用。人脸识别在安防行业的应用无外乎如下几种:
(1)1vs1身份确认。如火车站、宾馆等场合需要核实身份证与持证人员是否为同一个人,此类应用与金融行业的身份认证基本无异。
(2)1vsN实时比对报警。如在火车站、地铁站、机场等重要节点设置人员通道,对在逃人员等进行实时布控,一旦出现立即予以抓捕。又如商业应用,通过实时比对进店人员,发现VIP并提高服务质量,此类应用的需求最为强烈,而难度也最大,布控库的规模直接决定了系统是否可用、好用,下文将专门进行分析。
(3)静态库或身份库的检索。如对常住人口、暂住人口的人脸图片进行预先建库,通过输入各种渠道采集的人脸图片,能够进行比对和按照相似度排序,进而获悉输入人员的身份或者其他关联信息,此类应用存在两种扩展形式,单一身份库自动批量比对并发现疑似的一个人员具有两个或以上身份信息的静态库查重,两个身份库之间自动交叉比对发现交集数据的静态库碰撞。
(4)动态库或抓拍库的检索。对持续采集的各摄像头点位的抓拍图片建库,通过输入一张指定人员的人脸图片,获得其在指定时间范围和指定摄像头点位出现的所有抓拍记录,方便快速浏览,当摄像头点位关联GIS系统,则可以进一步的按照时间顺序排列检索得到的抓拍记录,并绘制到GIS上,得到人员运动的轨迹。
应用(3)和(4)通常情况下是有操作人员进行交互的,交互操作人的介入一定程度上提升了系统对算法绝对准确的依赖,当前已经取得较好的应用效果,并为公安行业的各项工作起到辅助作用。
以目前人脸识别中比较常见的应用1vs1身份确认为例,应用深度学习以后,正确率不断提升,甚至已经超过人类的识别正确率(97.5%)。图1给出了深度学习算法在LFW上的性能提升。可以看到,最近几年,随着深度学习在人脸识别中的研究越来越深入,香港中文大学的DeepID系列和google的FaceNet不断刷新着LFW正确率。但另一方面,在这个测试集上,各家算法的性能差距并没有拉开。这是因为LFW的注册集和测试集规模都较小,而且图片质量较好,相对比较受控。而在安防行业中,随着数据规模的增加以及场景越来越复杂,算法性能带来的差异会更大。例如,最近华盛顿大学公开了MegaFace测试集,包括690572个唯一ID和100万人脸图片。在这个测试集上,LBP只有2.3%的正确率,联合贝叶斯只有3.02%,而FaceNet则达到了70%以上。这一结果也说明了即使是目前最先进的人脸识别算法,在实际应用时,性能也还是不能令人满意。