近年来,以人工智能、区块链、云计算、大数据、物联网等为代表的新型技术不断促进金融创新,成为推动普惠金融、发展数字经济的重要引擎。生物识别技术作为人工智能中的一部分,具备识别速度快、识别唯一性、远程识别性等特点,在基础理论、算法模型、创新应用、软硬件支撑等方面不断取得突破,在银行中应用快速广泛。但生物识别技术本身易受网络攻击,可能引发用户隐私数据泄露、个人信息滥用等风险,甚至影响金融交易安全。本文将简要列举生物识别技术在银行业应用中可能涉及的应用场景及其相关风险,逐步推动生物识别技术在金融领域安全规范应用的探索和实践。

生物识别技术金融应用现状

生物特征识别技术是指通过计算机与光学、声学、生物传感器和生物统计学原理等高科技手段密切结合,利用人体固有的生理特性和行为特征来进行个人身份鉴定的技术,生物识别技术使用的生物特征主要包括指纹、人脸、静脉、虹膜、声纹、掌纹等。生物识别技术作为一种战略性新型技术,成为增强客户身份核实和认证的重要手段,可以在客户及员工身份识别、远程开户、审核管理、支付结算、风险防控等金融场景中发挥重要作用。

具体来看,指纹识别技术作为出现最早、发展最为成熟的生物识别技术,具有易于采集、准确率高、使用方便等特点,被广泛应用于金融系统的界面登录、支付验证等场景;人脸识别技术无需接触、操作方便,目前应用最为广泛,为金融领域的身份认证带来了极大的便捷;虹膜识别技术在准确性、防伪性、安全性等方面相较于其他生物识别技术有比较大的优势,主要应用于保险柜、现金押运等安全等级高的金融场景;声纹识别技术易于采集、成本低、使用方便,在金融领域的典型应用有身份认证、转账支付、现金取款、风险防控等多因素认证场景。

以验证客户身份的生物识别技术应用场景为例,近几年,几乎所有银行已经将人脸识别技术作为柜台上主要的用户身份认证方法,结合银行卡支付口令,进一步提升了身份认证的安全性。

生物识别技术应用的风险与挑战

01 生物特征信息易产生泄露风险

由于指纹、人脸、虹膜、声纹等生物特征隐私信息的固有特性、采集方式和集中存储方式,信息泄露风险相较于其他新型技术较大。一是特征信息具有唯一性,生物特征难以使用不同凭据具体对不同业务、场景、渠道进行安全隔离,各身份认证系统在生物特征信息被窃取后都可能被轻易绕过,影响范围广。二是采集行为极具隐蔽性,商场、旅馆、饭店、街道等各种公共场所均能够在用户无意识中收集其生物特征,不法分子通过远程、非接触方式可以 “无声无息”地非法批量采集生物特征信息。三是泄露风险高度集中,随着金融科技逐步大规模应用,生物特征数据存储集中度越来越高。一旦应用的生物特征库被攻破,极易导致大规模隐私泄露,甚至引发系统性风险。

02 设备及应用抵抗呈现攻击的水平参差不齐

呈现攻击一直是生物识别技术所面临的主要安全风险,呈现攻击检测技术(以下简称为PAD)也是生物识别系统大规模安全应用的重要基础。以人脸识别应用为例,呈现攻击方式可以分为二维呈现攻击(二位静态纸质与电子照片、二维动态图像、视频)和三维呈现攻击(三维面具攻击、高精度三维头模攻击),受制于硬件及算法能力差异,不同产品抵抗呈现攻击的能力错落不齐。当用户发起人脸识别请求时,算法需要判断此次生物特征来源于真人还是某类型呈现介质,PAD技术作为一种重要的算法领域,基于不同的传感设备,可以自行划分为不同数据模态的检测算法,包括基于2D摄像头的单RGB假体检测算法,基于3D摄像头的3D深度假体检测算法和基于红外摄像头的近红外假体检测算法,每一类型PAD算法所覆盖的攻击方式也能够根据假体呈现介质的不同而相应进行转换。

03 应用场景受算法性能限制可能产生发展瓶颈

一是环境变化影响较大,生物特征受采集过程中光照、噪音、遮挡等外界环境因素干扰较大,且随生物个体的年龄、着装等产生变化,影响识别算法稳定性。二是抗噪能力有待提升,与专业采集设备相比,常见通用设备(如手机摄像头、远程监控等)采集的生物特征信息分辨率低、噪声大,较难建立统一分辨率的样本库,给识别算法设计带来挑战。三是关键指标难以兼顾,识别算法的识别拒识率、误识率等关键指标相互关联,难以同时兼顾,需要开发方结合实际应用进行优化取舍。以人脸辨识为例,当样本库大小等其他因素固定时,识别通过率与误识率呈一定正相关性,服务提供方若片面追求高通过率和极致用户体验,可能给交易安全带来潜在风险。

04 算力存储依赖度高导致信息基础设施面临安全风险。

在前端算力方面,应用场景和渠道不断创新,识别精准度和响应速度要求持续提升,识别算法更加复杂化和模块化,算力需求逐步向前端设备迁移,亟需更加专业化的生物识别芯片、智能生物特征采集设备等前端硬件支撑。在后端支撑方面,生物识别技术逐步应用,催生出大量视频、图片、音频等非结构化数据的存储、传输和处理需求,亟需基于云计算、大数据等技术的基础计算与存储能力支撑。

05 生物识别模型面临窃取风险

针对机器学习模型的攻击手段层出不穷,给生物识别模型安全带来严重的安全隐患。虽然对机器学习模型的加固已有很多成熟的解决方案,但攻击者可以在模型训练过程中通过数据投毒(污染训练数据)从而影响最终的模型效果,或者是通过黑盒探测的方式,实现对算法模型的窃取,严重影响了模型的可用性和安全性。对生物识别模型的攻击,使得模型信息(例如模型结构与模型参数)泄露,可能导致算法的数据被逆向还原,进而造成严重的信息泄露,引发业务、资产安全风险。

06 供应链安全导致隐私泄露风险

引入第三方模型构建生物识别算法子模型,或导致供应链安全风险。受训练数据规模、训练机器资源等限制,目前很多厂商会利用第三方大规模数据训练后的模型作为母模型,并结合自身产品或者特定场景的少量数据做模型微调,将微调后的模型应用在商业产品中。第三方母模型普遍缺乏严格的测试管理和安全认证,存在未知安全漏洞,如果应用方自身风险评估机制安全扫描机制不完善、攻击者可以利用抗拒样本攻击等攻击手段,窃取或篡改用户的生物识别隐私信息或模型数据。同时,如果母模型供应方人为在母模型中预置后门,将存在更大的安全风险。

作者 |王艳

视觉 | 王朋玉

统筹 | 祖德光

声明:本文来自中国光大银行科技创新实验室,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。