王正为,杨红梅,李娜. 基于文献计量的人脸识别技术研究进展与趋势分析[J].世界科技研究与发展, doi:10.16507/j.issn.1006-6055.2018.11.001.
王正为,杨红梅(北方工业大学图书馆)
李娜(广州中医药大学马克思主义学院)
摘要:基于1991年以来全球人脸识别领域的研究论文和专利数据,对人脸识别技术的时间发展趋势、被引频次、产出国、研究机构等进行分析,并绘制引文编年图对演化路径进行解读。研究表明:中国和美国是目前世界上人脸识别研究领域综合实力最强的两个国家。美国在人脸识别的历史发展中起到了关键性作用;中国人脸识别研究整体水平已经进入世界先进行列,但整体学术影响力和科研质量有待进一步提高。从演化路径来看,人脸识别的技术演进经过了传统算法和深度学习算法两个阶段,后者是目前的主流算法。未来,提高在非理想环境下的人脸辨识度将是人脸识别研究的重点。
关键词:人脸识别;文献计量;HistCite;Pajek;VOSviewer
doi:10.16507/j.issn.1006-6055.2018.11.001
1 引言
人工智能被称为21世纪三大尖端技术之一,人脸识别技术因其方便快捷、应用广泛而成为人工智能领域中受到广泛关注的课题。广义的人脸识别包括人脸图像采集、人脸定位、人脸检测、人脸图像预处理、人脸对比、身份确认以及身份查找等。其中检测和对比是最主要的环节,特征提取是核心内容。基于深度学习的人脸特征提取方法是现在人脸识别技术的主流算法,目前最新的前沿算法有L-softmax、A- softmax、NormFace/CocoLoss、FeatureIncay、AMSoftmax/CosFace、InsightFace/ArcFace等。
人脸识别技术属于人工智能领域中落地性最强的具体应用范畴,世界各国发布的人工智能战略规划大多有利于推动人脸识别技术的发展。如:美国2016年发布的《国家人工智能研发战略规划》中提出“要开发可视化和人类与AI交互界面技术”;英国政府2017年发布的《人工智能产业发展报告》显示Facebook、谷歌、亚马逊、苹果、微软和百度等通过提高面部识别等技术来提高客户服务效果。世界范围内的人脸识别技术已经得以广泛应用,如:2013年,芬兰Uniqul公司推出了史上第一款基于脸部识别系统的支付平台;2015年,美国海关与边境保护局(CBP)开始对非美国居民使用面部识别技术;2017年澳大利亚开始试用新的“免人手处理”入境系统,即利用生物识别技术辨认入境游客的面孔、眼睛虹膜及指纹,取代传统出示护照的入境程序;日本计划在2020年东京奥运会采用人脸识别系统和购票系统进行无缝对接。
2015年以来中国相继发布了《关于银行业金融机构远程开立人民币账户的指导意见(征求意见稿)》、《安全防范视频监控人脸识别系统技术要求》、《信息安全技术网络人脸识别认证系统安全技术要求》等法律法规,为人脸识别在金融、安防、医疗等领域的普及打下了坚实的基础,扫清了政策障碍。工信部2017年12月发布的《促进新一代人工智能产业发展三年行动计划(2018—2020 年)》指出“到 2020年,复杂动态场景下人脸识别有效检出率超过97%,正确识别率超过90%”。中国在2017年、2018年连续两年将人工智能写入国家政府工作报告。数据显示,2017年中国在人工智能领域投资达到10.3亿美元。人脸识别技术作为人工智能中落地性最强的技术在良好的人工智能政策环境推动下得以向前发展。现今中国人脸识别已经在智能手机、金融、政务服务等领域展开了广泛应用,“刷脸”几乎成为了日常必须。周曦2011年带领团队成功研发出国内首套“人脸识别支付”系统,又在2015年作为带头人创立云从科技,相继发布了以“双层异构深度神经网络”、“3D结构光人脸识别技术”、“跨镜追踪技术”为代表的技术和产品,不仅打破了苹果Face ID的技术垄断, 还在相关指标参数上刷新了领域内的世界记录;2015年汤晓鸥与其计算机视觉研究组开发的DeepID深度学习模型再次超越人眼识别率,测试识别率达到了99.15%;中科奥森为人民银行征信系统提供身份核验及多光谱活体防伪技术授权,累计完成5000万次人证比对,无一误报;为支付宝、Uber等公司提供人脸识别技术的北京旷视科技有限公司(FACE++)的核心技术在2017年MS COCO、Places两项世界顶级竞赛中,击败Google、微软、Facebook,成为首个获得多项冠军的中国企业。
国内部分学者已经从不同角度对人脸识别的研究发展状况做出了分析。如:闫娟等对比了典型人脸识别商用产品和技术的识别效果;邹志煌等总结了人脸识别技术产品的发展概况和市场状况,对国内外典型人脸识别商用产品的实用算法进行了分析和比较;黄智等基于人脸识别的专利文献对人脸识别领域专利总体变化情况进行了统计分析和预测。本文则拟用文献计量的方法,对1991年以来人脸识别领域的相关论文和专利进行统计分析,进而对技术演进进行梳理,以期为进一步了解人脸识别的发展现状和趋势提供参考。
2 数据来源与分析方法
人脸识别论文数据来源是Web of Science核心合集中的SCI-EXPANDED、CPCI-S和CPCI-SSH;WOS类型选择与人脸识别相关的计算机科学人工智能、工程电子电气、计算机科学理论方法、影像科学摄影技术等共计13类。检索式为:TS=("FACIAL DETECTION" OR "FACIAL RECOGNITION" OR "FACIAL PERCEPTION" OR "FACE RECOGNITION" OR "FACE PERCEPTION" OR "FACE DETECTION" OR "FACE DETECT") AND WC=(COMPUTER SCIENCE ARTIFICIAL INTELLIGENCE OR ENGINEERING ELECTRICAL ELECTRONIC OR COMPUTER SCIENCE THEORY METHODS OR IMAGING SCIENCE PHOTOGRAPHIC TECHNOLOGY OR COMPUTER SCIENCE INFORMATION SYSTEMS OR COMPUTER SCIENCE SOFTWARE ENGINEERING OR TELECOMMUNICATIONS OR OPTICS OR COMPUTER SCIENCE INTERDISCIPLINARY APPLICATIONS OR AUTOMATION CONTROL SYSTEMS OR COMPUTER SCIENCE HARDWARE ARCHITECTURE OR COMPUTER SCIENCE CYBERNETICS OR ROBOTICS) AND DT=(PROCEEDINGS PAPER OR ARTICLE OR REVIEW) AND PY=(1991-2018)。检索日期2018年8月16日,检索结果21611条。
专利检索和分析数据来源为Innojoy专利数据库,以人脸识别的中英文同义词进行检索,数据库选择全部,时间设定为1991年至今。检索式为:TI=(面部验证 OR 面部核实 OR 面部识别 OR 面部比对 OR 面部对比 OR 面部认证 OR 人脸验证 OR 人脸核实 OR 人脸识别 OR 人脸比对 OR 人脸对比 OR 人脸认证 OR 人像验证 OR 人像核实 OR 人像识别 OR 人像比对 OR 人像对比 OR 人像认证 OR 面部图像验证 OR 面部图像核实OR 面部图像识别 OR 面部图像比对 OR 面部图像对比 OR 面部图像认证 OR FACIAL DETECTION OR FACIAL RECOGNITION OR FACIAL PERCEPTION OR FACE RECOGNITION OR FACE PERCEPTION OR FACE DETECTION OR FACE DETECT)。检索日期为2018年8月25日,共检索到49130条专利,在合并同族专利后共35807条专利。
研究的基本思路如图1所示。
3 人脸识别研究论文的统计和分析
3.1 发文趋势和被引用情况分析
从图2可以看到,1999年以前人脸识别领域的发文量并不多。1991年用高性能计算机来提取人脸特征值的人脸识别核心技术刚刚取得突破,人脸识别的商业市场需求尚未得到释放,相关商业应用很少。期间,美国FERET人脸库项目对算法改进和商业化应用的推广起到了巨大的推动作用,当时几种著名的人脸识别算法都参加了FERET项目在1994—1996年间组织的评测。
2000年后,机器学习理论蓬勃发展,研究者们基于机器学习理论相继探索出了遗传算法、支持向量机、流行学习等人脸识别方法。2009年前后,基于传统算法的人脸识别技术已经基本成熟,取得了大量可供市场应用的成果,同时也面临了新的挑战。随着人脸识别商业化的广泛应用,市场对人脸识别提出了新的要求,即非理想化的人脸识别技术问题,人脸识别技术进入瓶颈期。2009—2012年,基于稀疏表达和对遮挡因素的鲁棒性检测的人脸识别研究引起学者们的重视,在2013年前后,大量人脸识别技术商业成果广泛应用取得良好口碑,各国政府纷纷开始重视对人工智能的研发,在政府扶持和市场需求的双重驱动下,人脸识别技术研究得以再次推进。在技术方面,大数据技术和深度学习方法蓬勃兴起,基于深度神经网络的人脸特征提取在人脸识别技术应用中逐步推广,其辨识度和特征提取等方面超越了传统识别技术的结果,人脸识别技术研究再次向前推进。
3.2 研究主题分析
利用VOSviewer统计人脸识别领域中的高频词,总结人脸识别领域科研人员关注的重要研究主题聚类(图3)可知,此领域的主要研究主题有4类(表1)。这些研究主题呈现较为明显特征是:中心突出,聚类1包括的范围很广,处于研究的核心位置,其他聚类内容都与聚类1有一定相关性,说明各个研究主题的实质和目的都是在运用不同算法实现人脸的检测与识别,提高人脸的最佳识别度。另外,阅读对比中国和美国的相关文献发现,两国的论文均基本涵盖了这一领域的所有主题,且研究主题交叉和重合程度很高,研究内容主题基本相似。不同的是,美国在此领域的研究主题开展时间往往要早于中国。
3.3 研究国别产出分析
在人脸识别领域,发文量排名前10位的国家/地区的发文总量(表2)占全球总发文量的82.64%,基本囊括了人脸识别技术研究领域取得的全部重大成就。其中,中国的发文量最多,是美国的2倍以上,但篇均被引频次仅为4.65,远低于美国的14.29。这说明中国在此领域的研究论文虽然具有数量优势,但质量还需进一步提升。
中国和美国在人脸识别领域的发文量合计占全球总发文量的49.80%。为了进一步对比两国在此领域的研究差异,将其发文量和被引频次做单独对比,如图4所示。
美国对人脸识别技术研究起步较早,1991年的特征脸、1993年的灰度几何和模型特征、2002年的Fisherface等经典算法和奠基性理论等均由美国最先提出,这些算法在人脸识别技术发展中起到奠基性作用,被广泛关注和使用。同时美国具有明显的科研优势,除拥有先进的科研条件外,大量的机器视觉方面的顶尖级科研人才如Wright John、Phillips PJ等云集于美国,为美国在人脸识别领域创造了大量经典的开创性科研成果。另一方面,或因科学界的马太效应,美国凭借原有优势科研成果的历史影响力,其论文在知识积累和传播过程中更容易引起重视。美国在该领域知识积累、发展和传播过程中做出的巨大贡献使其在知识整体流动过程中起到主导作用。
中国人脸识别方面的发文量在2004年后超过美国,以中科院自动化研究所为代表的科研机构进展迅速,但起步较晚,影响力大都低于美国。2008年后中国发文量猛增,论文被引频次同时上升,在2017年几乎与美国持平。
3.4人脸识别研究国别合作分析
全球人脸识别领域论文主要高产国家的合作网络呈现3个聚类(图5、表3)。其中,中国、美国、印度、日本等国实力较强,科研人员的交流和科研合作项目较多,在促进本国研究实力提升的同时,也有力推动了该领域知识的流动。从全球的合作网络整体来看,由于科研实力雄厚,中国和美国处于网络的核心地带,与其他国家联系最多,这也为两国加快吸收该领域最新研究成果、推动本国在该领域的快速发展提供了重要技术支撑。
3.5 论文产出机构分析
排名前10位的科研机构(表4)中,7所来自中国,但仅香港理工大学的篇均被引表现较好。结合中美两国人脸识别年度发文和被引频次对比可以看出,近年来中国在此领域的整体科研实力发展迅速,涌现出一批以中科院为代表的优秀科研机构,论文成果产出数量大幅度提升,但质量与美国和其他发达国家仍有一定差距。
为了进一步展示世界科研机构在人脸识别领域的科研实力和科研质量,我们统计了总被引频次最高的10所科研机构(表5)。其中美国有6所、中国4所(中国香港1所)机构入围。篇均被引频次最高(455次)的美国耶鲁大学只有12篇文献,这主要得益于Belhumeur等做的耶鲁人脸数据库方面的研究;排名第2位的美国国家工程技术研究所的Phillips等对人脸识别算法的研究,尤其是著名的FERET人脸库测试对人脸识别传统算法起了巨大的影响。人脸识别算法的研究和优化,需要以标准的人脸数据库为基准,构成实验中的训练样本集和测试样本集,耶鲁人脸库和美国FERET人脸库是目前最著名的公共人脸数据库。美国伊利诺伊大学是美国伊利诺伊州的一个大学系统,著名的贝克曼研究中心(Beckman Institute)和协同科学实验室(Coordinated ScienceLaboratory)均属于这个系统。贝克曼研究中心以尖端科技闻名世界,在与人脸识别相关的图像处理、机器视觉、生物医学成像方面均处于世界先进水平。微软亚洲研究院2005年提出的“拉普拉斯脸”人脸识别改进算法、麻省理工学院1991年提出的“特征脸”等研究方法均为早期人脸识别中的经典算法,对后来传统人脸识别算法的发展起到了奠基性作用。
南京理工大学图像特征抽取与人脸识别、智能监控,哈尔滨工业大学的图像处理与识别、计算机视觉领域研究在业内都有一定的影响力。中国科学院系统的自动化研究所、计算技术研究所、深圳先进技术研究院等在人脸识别相关领域做出了突出贡献。其中,中科院自动化研究所的李子青团队在统计模式识别与机器学习理论、图像处理与计算机视觉方法、人脸识别与智能视频分析应用领域,赫然团队在模式识别、计算机视觉、机器学习领域具有一定的国际影响力;中科院计算技术研究所的高文团队致力于计算机视觉、模式识别与图象处理方面研究,取得不少优秀成果;兼任中国科学院深圳先进技术研究院副院长的香港中文大学教授汤晓鸥2014年提出的人脸识别技术(Gaussian Face/Deep ID)识别率达到98.52%,成为世界上第一个超过人眼识别能力的计算机算法,2015年提出的Deep ID识别率更是达到99.15%。
结合前文可以看出,中国和美国是人脸识别领域发文量最多的两个国家。美国人脸识别领域研究起步较早,拥有多所世界先进的科研机构,有多次的开拓性发现,科研成果质量很高,在人脸识别研究的知识传播中起到了重要作用。中国相对于美国起步较晚,但近年来迅速崛起,发展迅速,涌现出一批以中科院等为代表的科研机构,整体科研成果很多,已进入世界先进行列,但与美国相比在科研成果质量上尚有一定上升空间。
3.6 研究机构合作分析
全球人脸识别高产科研机构合作网络有4个聚类(图6),科研机构合作网络特征如表6所示。其中,中国的研究机构分布于3个聚类中,中国科学院、清华大学、上海交通大学等机构与美国的马里兰大学、新加坡国立大学等机构人脸识别研究实力强,合作较为紧密;另外两个集团群则更倾向于国内合作,与国外机构的联系相对较弱。
4 人脸识别专利的统计和分析
4.1 专利申请趋势分析
从图7可以看出,1998年以前,人脸识别领域专利申请量增长缓慢;之后,随着全球人工智能领域的发展,人脸识别技术在金融、安防等领域的应用不断成熟,各国研发组织纷纷投入到人脸识别技术研究中;2009年前后,基于传统算法的人脸识别应用技术趋于成熟,同时也遇到了非理想化状态下识别难度提升的挑战,2010年左右专利申请量有所下降(与人脸识别论文发表情况相似);很快,基于深度神经网络算法的人脸识别研究迅速出现,突破了技术瓶颈,2011年以后人脸识别专利申请量再次大幅度提升。
4.2 专利申请技术主题类别分析
从表7可以看到,全球范围内的人脸识别专利技术分布一方面与人脸识别技术处理方式的关键过程密切相关,从人脸的发现和检测处理到人脸图像分类与定位、动作识别、图像传输等都有所涉及。另一方面与人脸识别技术的应用相关,如在金融领域、政务领域、互联网领域的应用等。
4.3 专利申请人分析
全球人脸识别专利权人的类型主要分为三类,一类是从事数码相机和智能手机相关产品的厂商,其专利主要集中在人像检测和处理等技术领域,排名靠前的厂商包括佳能、索尼、富士等;第二类是目前的互联网巨头,主要集中在人像检测、分类、识别、传送等领域,排名靠前的有微软、谷歌、IBM、英特尔等,这类企业是全球人脸识别技术领域最具备活力的厂商;第三类是电子制造业巨头和集数码产品、智能手机、人工智能等研发与生产于一身的新型高新技术企业,如三星、卡西欧、富士康和中国的小米、华为等,这类企业在工业应用领域有着很强研发实力(图8)。
4.4 中美专利对比分析
中美两国是人脸识别领域专利申请意愿最强的国家(图9),最具竞争力。可以预见未来人脸识别领域的市场竞争主要会在这两国之间展开。为了更好地对比中国和美国在人脸识别领域的专利布局情况,我们将中美两国专利申请年度申请量和专利权人做单独对比。
从图10看到,从2014年开始美国人脸识别领域专利申请量出现明显下滑迹象。这是因为2014年后美国的微软、IBM和谷歌等专利申请大户的专利申请技术方向发生了转移,更倾向于电数字数据处理(GO6F)、数字信息的传输(H04L)和半导体器件(H01L)这三个技术类别的申请。
中国人脸识别技术专利申请量增长得益于近年来中国政府大量出台的人工智能和智能制造国家政策,尤其是2015年以来中国相继出台的多个人工智能行业发展政策加速了人脸识别技术的创新和发展,提升了商业化落地的能力。在国内良好政策环境激励下,企业和研究机构在此领域持续进行技术研发,中国人脸识别技术逐渐成熟。中国在深度学习方面的专利是美国的6倍,推动中国AI发展的正是人脸识别和AI芯片技术。
中美两国排名前20位的专利申请人(图11)中有大量是外国企业在做专利布局。基于中美两国在人脸识别领域的巨大前景和市场,众多大型企业十分重视在两国的市场开拓和发展,积极进行专利布局,其中以日本的佳能、索尼和韩国的三星等最为明显。
美国本土专利申请人主要来自于互联网巨头和电子制造业巨头,如微软、IBM、谷歌、英特尔、苹果、高通等等都拥有大量的人脸识别专利。这表明美国人脸识别专利技术研发和实施的主体主要来自于大型企业,这类企业具备强大的资金优势和科研优势,对未来商业市场动向嗅觉灵敏,十分注重在人脸识别领域专利技术的开发与应用。
中国本土专利权申请人中分为两类。一类是高校和科研院所,其中以中科院自动化所、上海交大等为代表的科研院因其自身的科研实力在人脸识别技术的专利申请上具备优势;另一类是企业。中国企业专利申请人又可以分为三种类型。一是以广东欧珀、小米、腾讯、北京旷视等为代表的高科技公司。这类申请人因企业自身的市场定位和产品发展需要,凭借其科技优势在此领域的专利申请中极具活力,发展前景巨大。如广东欧泊和维沃移动通信专注于智能手机研发;小米侧重于移动终端;北京旷视则是专门从事机器视觉领域研究。这类企业为了能够在市场竞争中争取主动,保证自身产品生产与销售的安全可靠性,在人脸识别领域申请了大量专利,以保证能够独占市场,进而换取更大的经济效益。随着未来人工智能领域的发展,为了自身企业的生存与发展,这类企业中将会有大量的人脸识别研发成果产生。二是为其他厂商提供人脸识别技术支持或出售自身人工智能领域产品的企业,如中星微、汉王等。这类企业同样致力于电子科技类新产品、新技术的研发和推广,随着人工智能领域的向前发展和推进,这类企业会与第一类公司一样在人脸识别领域具有很强的研发实力。第三类是传统的制造业企业,这类企业在其自身产品创新过程中加入了人脸识别技术,同样注重对人脸识别技术专利的申请。如贵州永兴主要是在万用电炉安全系统中添加了面部识别技术,以提高电炉使用的安全性;苏州福丰则是在保险柜、监控视频等加入了人脸识别技术。这一类申请人属于一般工业制造企业,对人脸识别专利的申请主要基于其某阶段的某类产品而研发,对人脸识别技术的专利申请具有爆发性而非持续性,如苏州福丰的一百多项专利是在2013年和2014年申请,贵州永兴的一百多项专利都是在2014年申请。
从人脸识别专利申请统计分析来看,多个国国家都在进行专利布局,其中日本和韩国的海外专利布局不可忽视,中国和美国的专利申请量最大。围绕人脸识别核心技术和商业用途,全球申请人在数据识别、数据表示、记录载体、记录载体处理等技术领域专利布局最多。美国微软、IBM、谷歌等互联网和电子制造业巨头是人脸识别专利技术研发和实施的主体,拥有大量的人脸识别专利。中国良好政策环境的激励加速了中国人脸识别技术创新应用的发展,提升了商业化落地能力,除了上海交通大学、中科院等多个科研机构,还涌现出一大批以欧珀、小米、华为等为代表的高新科技企业,同样成为了人脸识别技术研发的主体。
5 人脸识别技术演进分析
5.1 高被引文献引文编年图解读
人脸识别技术演进的本质是研究者们不断寻找合适的算法对人脸属性分离、特征提取和分类判别,不断克服非理想状态的影响从而达到人脸识别辨识度最佳效果的过程。对人脸特征值的提取则是实现人脸识别的关键。
本文采用HistCite中本地被引频次LCS值(取前50)来绘制引文编年图。编年图中的文献被分为两部分。右边是从1991年的1号文献到2011年的9466号文献所形成的一个复杂化网络,我们将其称之为脉络1。左面是单独的一个文献2014年的13509号文献,我们将其称之为脉络2。对两个脉络的文献进行阅读和比对发现:1991—2011年对人脸特征值提取的方法主要基于人工(脉络1);2014年及以后则是基于深度学习(脉络2)。
脉络2仅有2014年的一篇文献,是因为HistCite的编年图以论文被引频次为划分依据,而被引频次受时间影响,2014—2018这4年间人脸识别领域关于深度神经网络算法的高被引研究论文因为时间关系尚未出现很多。其本身还必须引用早期传统经典算法的理论,这也使得人工特征值算法时期的文献被引频次不断积累和增加。但是目前深度学习方法已经成为人脸识别的主流研究方法,随着时间的推移,研究不断深入,未来此方法的高被引文献会不断涌现。
由于脉络1与脉络2差别很大,为了验证这一关系是否正确,我们再次选取了LCS值为前60、80、100位的文献分别进行测试,结果显示与LCS排名前50的文献所形成的编年图类似,但结构更复杂,不利于观察。所以我们采用LCS值排名前50的文献编制编年图。
5.2 技术发展的历史演进路线分析
脉络1的网络过于复杂,不利于对学科发展脉络的把握。利用社会化软件Pajek将编年图中的复杂网络处理后,梳理出主路径,如图13、表8所示。这些文献的内容能够代表人脸识别的发展历程。
通过对表8中及相关文献阅读,将人脸识别的发展与演变过程梳理如下:
1)基于人工方法特征值提取的人脸识别研究阶段(1990—2013)
1991年麻省理工的Turk和Pentland提出的特征脸(Eigenface)方法,对人脸检测和识别进行跟踪比对,用特征脸定义一个包含特征向量的人脸集合空间,然后把新的人脸头像作为一个2D的直立头像,将之投影到这个特征脸空间中进行比对,从而达到识别目的。特征脸被认为是第一种有效的人脸识别方法,也是人脸识别应用最早、最广的一种方法。1992年的22号文献是对自动化系统中人脸的检测、识别、表达函数分析、物理特征分类等人脸检测与识别子问题的综述,并提出了相应的解决算法。1993年的42号文献是麻省理工学院Brunelli提出的两种人脸识别新算法,一种是基于几何特征(如鼻子宽度和长度、嘴巴位置和下巴特征等)的人脸识别方法;另二种是基于灰度模板匹配的人脸识别算法。测试集结果表明,使用几何特征的正确识别和模板匹配的完美识别度约为90%。
这3篇文献构成了人脸识别算法的一个开端,它们汇集到1995年的99号文献(对前一时期各类人脸算法的总结)。在此基础上,1997年Belhumeur等提出了著名的Fisherface算法,先利用主成分分析(PCA)对图像进行降维,然后再用线性判断分析(LDA)变换降维处理后得到的主成分。这个方法是这一时期人脸识别技术研究中一项非常重要的成果。因为大量测试表明:Fisherface方法的错误率要明显低于早期特征脸方法。这里所提到的LDA和PCA是机器学习的重要方法,LDA是有类别输出的有监督学习的降维技术,需要考虑数据集中每个样本,而PCA是不考虑样本类别输出的无监督降维技术,一般观点认为LDA算法优于PCA算法。2001年的1031号文献是对这一观点进行的检验,即LDA和PCA的对比研究,由美国普渡大学(Purdue University)的Martinez等完成。Martinez等通过实验得出了一个十分有价值的结论,即当训练数据集小时,PCA可以优于LDA,同时PCA对不同的训练数据集不太敏感。这一结论对后来的线性判断和降维方法在人脸识别中的应用起到了重要的影响。
2002年的1366号文献对主成分分析、支持向量机、隐马尔科夫模型和神经网络等多种在单个图像中检测人脸的算法进行分类和评估,,发现鲁棒性高的面部检测系统会受到光照变化,方向、姿势以及部分遮挡,面部表情和眼镜、发型等影响,这为以后的人脸识别研究提供了方向。此时,光照、遮挡等非理想化识别问题被正式提出。针对此类问题,2002年美国普渡大学的Martinez再次提出一种能够为不精确局部化、部分遮挡和表情变化的人脸做出补偿的概率方法,即1405号文献。该研究指出,为了解决局部遮挡问题,可以将人脸图像划分成局部小块进行分析,再对每个局部区域上获得的结果加权,从而提高识别率。
2003年的1964号文献又是对前期人脸识别的一个再次综述,该文献指出广泛的商业和执法应用是人脸识别技术引起广泛关注的原因,并对一些人脸识别算法进行述评,认为现阶段的算法在应对室外环境以及光照变化方面仍存在挑战。2006年的4610号文献提出了基于局部二值模式(LBP)纹理特征的人脸图像表示方法,将改善的LBP方法应用到人脸识别中,在FERET数据集上进行了测试,并与PCA、贝叶斯等算法进行了对比,实验结果表明在该数据集的fc和dup Ⅱ部分,LBP算法取得了最优的检测效果。
2009年的8056号文献是基于稀疏表示的鲁棒性人脸识别研究,提出的算法框架结构对人脸识别中的特征提取和遮挡鲁棒性两个问题提出了新的研究范式。在这个文献后面出现了两个分支。一个是直达8967号文献作为终点,另一个是经过9261号文献然后归结于9466号文献作为终点。
2010年的8967号文献新提出了一个无监督的降维方法,即稀疏保持投影(SPP)法,这种方法与保持局部信息领域的局部保存投影(LPP)和邻域保持嵌入(NPE)技术不同,降维是为了通过最小化的L1正则化相关目标函数,以实现保持稀疏的重建关系的数据。而所获得的投影对于数据的旋转、重新缩放和平移能够保持不变,更重要的是,即使没有提供类标签,也能包含自然鉴别信息。SPP方法能够自动选择其邻域,比LPP和NPE在实践中更方便使用。在美国AR人脸库、耶鲁大学脸部数据库和耶鲁大学拓展脸部数据库B等主流人脸库的有效性验证中取得了可喜的成果。
2010年的9261号文献提出通过线性回归方式(LRC)来制定模式识别问题从而进行人脸识别,该算法将人脸识别定义为一个线性回归问题,使用最小二乘估计参数向量。LRC算法处理了面部表情变化和连续遮挡的问题,大量实验证明,LRC方法能产生高识别精度,且不需要任何面部定位和标准化的预处理步骤。2011年9466号文献对稀疏表示和协同表示在人脸识别中的作用进行了分析,并提出了一个简单有效的人脸分类方案,即基于正则化最小二乘的协同表示分类。当时多数文献都忽略了协作表示在稀疏表示分类中的使用,该文献对稀疏表示分类的工作机制进行了分析,指出了稀疏表示的优点在于协作表示而不是L1范数稀疏性,这使其具有强大的人脸分类能力。
总而言之,提高人脸识别的精准度是人脸识别的最终目的。1991—2011年的人脸识别主脉络1其实就是研究者在在不断寻找新的算法、尝试使用新函数来提高人脸辨识度的过程;也是不断解决环境影响带来的识别度影响,提高人脸识别鲁棒性的过程,因为遮挡、光线等非理想化状态一直是影响识别度的重要因素。
2)基于深度学习方法特征值提取的人脸识别研究阶段(2014至今)
脉络2体现的是深度学习方法的人脸识别研究,这一时期人脸识别算法研究的典型特征是基于深度神经网络方法来进行人脸特征提取。脉络2中仅有2014年发表的3505号一篇文献,是Taigman等在Facebook人工智能实验室的研究结果, DeepFace。该人脸识别方法使用3D对齐技术将对齐结果送入一个9层网络,利用基于深度学习的卷积神经网络进行处理。
文献被引频次会受到时间的影响,因此基于深度学习的人脸识别研究文献在编年图中还没有得到充分体现。随着人工智能领域研究的不断深化,目前深度神经网络已成为人脸识别研究的主流算法。除了Taigman的DeepFace外,还有谷歌提出的FaceNet网络结构,以及深度学习方法来提取人脸高级特征(high-levelfeatures)的DeepID算法等,汤晓鸥团队提出的DeepID算法人脸识别率达到了97.53%,超越了人眼识别率。第三代基于卷积神经网络的DeepID 3技术对CNN结构做了较大改进,采用图像识别方面的最新网络结构,虽然识别精度没有比上一代DeepID2更高,但其网络层数比上一代有所加深。可以说从这个时候开始人脸识别真正进入到了人工智能时代。
综上,按照对人脸特征值提取方法的不同,对人脸识别研究可分为两个阶段。即脉络1,基于人工特征提取的人脸识别研究;脉络2,基于深度学习的人脸特征提取的人脸识别研究。二者的共同之处为:目的都是在不断克服非理想状态化的影响提高识别度,核心思想都是对人脸特征值的提取。不同之处是前者对特征值的提取是基于人工的办法,后者则是基于深度神经网络,是目前的主流算法和人脸识别技术研究的发展趋势。
6 结果与展望
全球人脸识别技术研发领域中,美国和中国综合实力最强。美国起步早、科研质量高,从传统算法Eigenface、Fisherface到目前深度学习算法Deepface、FaceNet等均起源于美国。麻省理工学院等科研机构在人脸识别基础研发过程中成果显著,是人脸识别技术研究先驱,微软、谷歌、Facebook等巨型跨国企业在人脸识别的商业化应用和开发中起到了巨大的推动作用。中国人脸识别领域研究在国家相关政策的带动下,正在赶超美国。以中科院、哈工大、南京理工大学为代表的科研机构和欧珀、华为等为代表的高科技企业生产出了大量的科研成果,在人脸识别领域同样取得了不斐的成绩。人工提取人脸特征的人脸识别传统算法不断积累和突破,在人脸识别技术演进过程中起到了重要的奠基性作用。深度学习算法在特征提取和辨识度上超越传统算法,成为该领域的主流算法。DeepID深度学习模型的人脸识别测试识别率达到99.15%,超过人眼辨识度。克服遮挡等非理想化环境带来的影响、提高人脸识别辨识度是人脸识别技术发展的目的和内在动力。多种算法的人脸识别整体性研究、基于深度神经网络人脸特征提取研究、非理想状态人脸识别研究和3D人脸识别研究是全球人脸识别领域的研究热点。其中3D人脸识别研究是人脸识别目前较为新兴的领域;数据识别、数据表示、记录载体、记录载体的处理(G06K)和图像通信(H04N)等技术主题是人脸识别专利申请的最热门领域。
继续不断改良和优化、寻找和创新算法研究是未来人脸识别技术的研发热点。提高在非理想环境下的人脸辨识度研究依然是未来人脸识别技术研发面临的挑战。降低成本、实现系统集成便携设备的研发很可能会是未来人脸识别技术商业应用的发展趋势之一。
为进一步提升在人脸识别领域的竞争力,中国需在数量优势的基础上进一步提升科研质量,弥补自身短板、不断创新。其一,要加强对人脸特征提取新算法研发、深度学习的底层架构研发、运用FPGA实现算法的实时性便捷性检测等一系列人工智能核心性技术的自主研发,打破美国的技术垄断。其二,要注重人工智能新兴领域的开拓性研发,如在机器学习领域的人脸识别技术研发、量子计算与人工智能的结合、远距离人脸识别技术研发和3D人脸识别技术研发等,从技术的跟随者变为技术引领者。
声明:本文来自世界科技研究与发展,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。