人脸识别是身份识别的一种,是计算机视觉领域很典型的应用。与指纹识别、虹膜识别类似,人脸识别的目的就是要对图片和视频中人脸的身份进行判断。
人脸识别的过程有四个关键步骤
- 首先,机器根据眼睛、眉毛、嘴巴、鼻子等器官的特征以及相互之间的几何位置关系来检测人脸。
- 其次,系统会对检测到的人脸进行人脸校对预处理,以获得位置端正的人脸图像。
- 然后,人脸图像的像素值会被转换成紧凑且可判别的特征向量。理想情况下,同一个主体的所有人脸都应该映射到相似的特征向量。
- 最后,进行人脸图像匹配与识别。系统将待识别的人脸特征与已得到的人脸的特征模板进行比较,根据相似程度对人脸的身份信息进行判断。
人脸识别与其他身份识别技术相比,具有便捷性、非强制性、非接触性、并行处理和可扩展性等显著的优势。
基于以上特点,人脸识别技术的应用场景十分广泛。
人脸识别技术的应用场景
商业领域:人脸识别技术是无人经济得以实现的重要支撑,人脸识别为无人经济创造了数据入口。识别会员是人脸识别在商业领域的典型应用,系统可以在VIP顾客入店时自动识别其身份,随后通过终端设备提醒服务员。
安防领域:智慧交通、治安管理、门禁管理等,这些安防场景都离不开人脸识别技术的支持。安防与人脸识别有着天然的契合点,因此人脸识别技术最先在安防领域得到广泛应用。
娱乐领域:人脸识别技术在娱乐领域同样应用广泛。基于智能人脸检测定位技术,可以打造移动端美颜、美妆效果解决方案;人脸关键点检测+人脸分割的组合则成就了近年来大热的AI换脸技术。
金融领域:“刷脸”支付是人脸识别技术在金融领域非常典型的应用。此外,多家银行升级了ATM机,其搭载的人脸识别技术全部采用最新的红外双目摄像头活体检测技术,能够完全抵御照片、换脸视频、翻拍、面具攻击。
当然,头部姿势、年龄、遮挡、光照条件、人脸表情会影响人脸识别的精准度。
基于深度学习的技术而言,训练数据的数量很大程度上影响了技术效果,提升训练数据的数量和质量成为解决上述问题的根本途径。
为了提升人脸识别准确性,不少平台开发了人脸识别标注数据集,以下分享12个经典开源人脸识别数据库。
12个经典开源人脸识别数据库
1、PubFig: Public Figures Face Database
这是哥伦比亚大学的公众人物脸部数据集,包含有200个人的58k+人脸图像,主要用于非限制场景下的人脸识别。
网址:https://www.cs.columbia.edu/CAVE/databases/pubfig/
2、color FERET Database
该数据集涵盖不同表情、光照、姿态和年龄条件下的人脸图像,每幅图中只有一个人脸。数据集中包含1万多张多姿态和光照的人脸图像,是人脸识别领域应用最广泛的人脸数据库之一。
网址:https://www.nist.gov/itl/products-and-services/color-feret-database
3、Large-scale CelebFaces Attributes (CelebA) Dataset
香港中文大学汤晓鸥教授实验室公布的大型人脸识别数据集。该数据集包含有200K张人脸图片,人脸属性有40多种,主要用于人脸属性的识别。
网址:http://mmlab.ie.cuhk.edu.hk/projects/CelebA.html
4、CMU Multi-PIE
由美国卡耐基梅隆大学建立。数据集中包含337位志愿者的75,000多张多姿态图像,涵盖不同光照和表情下的面部图像。
网址:https://search.wellspringsoftware.net/
5、Multi-Task Facial Landmark (MTFL) dataset
该数据集包含了将近13,000张采集于网络的人脸图片。
网址:http://mmlab.ie.cuhk.edu.hk/projects/TCDCN.html
6、The BioID Face Database
这个数据集包含了1,521幅分辨率为384x286像素的灰度图像,每一幅图像来自于23个不同的测试人员的正面角度的人脸。
网址:https://www.bioid.com/facedb/
7、CASIA-FaceV5
该数据集包含了来自500个亚洲人的2500张人脸图片。
网址:http://biometrics.idealtest.org/dbDetailForUser.do?id=9
8、Person identification in TV series
该数据集所选用的人脸照片均来自于两部比较知名的电视剧,《吸血鬼猎人巴菲》和《生活大爆炸》。
网址:https://cvhci.anthropomatik.kit.edu/~baeuml/publications/semi-supervised...
9、YALE人脸数据库
由耶鲁大学计算视觉与控制中心创建,采集每位志愿者的10张照片,共包含15位志愿者的165张图片,涵盖了光照、表情和姿态的变化。
网址:http://cvc.cs.yale.edu/cvc/projects/yalefaces/yalefaces.html
10、IMDB-WIKI
包含524230张从IMDB和Wikipedia爬取的名人数据图片,可用于年龄识别。
网址:https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/
11、Labeled Faces in the Wild Home
LFW数据集是为了研究非限制环境下的人脸识别问题而建立的。这个数据集包含超过13,000张人脸图像,均采集于网络,可应用于评价Face Verification算法的性能。
网址:http://vis-www.cs.umass.edu/lfw/
12、YouTube Faces
YouTube Faces中的数据可用于人脸验证,算法需要判断两段视频里面是不是同一个人。
网址:http://www.cs.tau.ac.il/~wolf/ytfaces/