作者:兴业银行 金钰 朱鋆 贾黄林

随着支付业务和技术的不断发展,交易欺诈的屡屡发生逐步成为困扰金融、电商等企业的主要问题。Kroll行业调查显示,全球有超过84%的企业遭受过欺诈问题的困扰。而在金融行业,这一数字是91%,在所有遭到欺诈的行业中排名榜首。《中国银行卡行业发展蓝皮书》显示,交易欺诈(伪卡交易、电信诈骗、互联网欺诈)成为了造成国内银行业过去几年损失最严重的前三大欺诈手段。国外研究机构统计结果显示,外部欺诈风险每年导致全球银行损失金额达736亿美元,境内银行每年欺诈风险损失也达上百亿元人民币。

为满足人民银行120号文中“通过交易行为分析、机器学习等不断优化风险评估模型,提高欺诈交易拦截成功率,切实提升银行卡交易安全防护能力”的要求,同时为了应对更为严峻的欺诈风险形势,兴业银行信用卡中心基于大数据技术,依托具备自我识别学习能力的反欺诈技术,做到将移动互联、大数据、人工智能等新技术与欺诈风险防范更好地结合,提升欺诈风险的侦测能力及处理效率,以实现对欺诈风险的自动化、智能化、精确化的管理。

一、现阶段国内银行业主流反欺诈手段

现阶段,国内银行业主要通过准实时的专家系统和建立事后案件分析的闭环来侦测欺诈交易和行为。基于传统专家规则反欺诈业务流程如图1所示。

图1 基于传统专家规则反欺诈业务流程

传统专家规则反欺诈业务流程包括场景建立、防范侦测、结果反馈和案件分析,基于交易数据流,由专家根据过往经验推演出交易统计模型和风险决策引擎,在此基础上再判断交易是否存在低、中、高等不同层级的风险,若存在风险即阻断交易,并将具体情况上报而后作具体分析。传统的交易欺诈侦测在效果和应用方式上存在着较为明显的“天花板”。

一是基于专家规则的决策引擎存在瓶颈:专家规则可能有数百上千条,都基于历史案件发生后的事后总结,且特征涵盖范围有限,业务实际效果存在瓶颈,无法应对突发的“新型欺诈案件”。

二是业务告警逻辑的处理机制复杂:多种校验方式结合下的处理逻辑复杂,甚至牵涉到跨系统交互,影响到事中交易检测和使用的实时性能要求。

三是欺诈案件的分析与系统运维难度大:需要人工定期进行事后总结与分析,更新专家规则,否则侦测效果逐步衰减,然而新增规则后的性能测试过程复杂,增加了后续运维难度。

二、基于机器学习技术的反欺诈技术

以机器学习为核心的建模方法能够大幅提升预测的准确程度,是新一代风险防控一体化平台建设的技术支撑。

基于机器学习的反欺诈解决方案,是通过从交易报文、用户、卡片等信息,训练出一个高维度模型,从而找出一些很难被专家规则发现的特征,这恰恰是机器所擅长的。

整体而言,传统大数据的分析思路表现为“抓大放小”:仅对样本进行抽样处理、仅使用最具区分度的统计信息、规则数量有限,这使得它无法吸收低饱和的噪音数据、需要人工修正错误、不易扩展新特性,且触发量也不易控制。与之相比,人工智能技术则能做到“面面俱到”:它能采用全样本采集、充分开发日益丰富的大数据、吸收并融合不同来源的数据,亦能对微观级的事物进行描述,这使得人工智能技术具有迭代学习、易扩展新特性和对接应用方式更全面等优势。

在数据预处理环节,智能反欺诈解决方案采用全量样本进行数据建模。在特征工程阶段,机器学习和专家规则一样,首先需要抽取交易报文、用户信息、客户卡片档、历史黑样本等基本信息,之后再结合其他已有数据,在符合业务逻辑的情况下,通过将交易报文中的原始字段进行超高维组合、衍生。最终,基于大数据机器学习模型的反欺诈特征体系通过与大量的专家规则进行对比,探索发现有效特征维。

机器学习对于出现概率低的“非典型特征”以及不断更新中的特征都有着超强的识别、总结能力。交易欺诈从数据上看实际上是一些模式的变化,如果是非典型的欺诈手段,较难被专家规则命中,但机器学习的模型可能捕捉到这些异常模式。具体来说,某次交易会同时命中多条弱模式,从而识别出该笔交易为欺诈交易。除此之外,即使欺诈手段发生彻底的变化,机器学习也可以从案例中不断自主更新学习,以适应新的欺诈手段。

1.全量样本,泛化学习交易维度的各种行为

机器学习使用全量样本进行数据建模,使模型能够发现无数个潜藏在数据中的个案,抓住价值长尾。机器学习建模能大幅提高模型预测结果的准确程度,专家建模方法和机器学习建模方法比对如图2所示。

图2 专家建模方法和机器学习建模方法比对

2.全量特征,高维稠密矩阵,覆盖欺诈行为各维度

机器学习使用全量特征进行数据建模,可以发现隐藏在数据中的规律。业务人员无需再做特征相关性试验,而是不断思考和创造与建模目标可能有影响的特征,让机器完成潜在知识的发现。业务规则与超高维稠密矩阵下机器学习模型的综合应用能大幅提升交易欺诈侦测率和覆盖率。

3.模型自学习,生产系统结果的迭代与调优

机器学习建模完成后,通过批量或实时预估结果的反馈输入,进行增量或全量更新,从而实现生产系统的自学习迭代,极大提升了模型的时效性。

4.结合长、短历史交易数据的学习和应用

例如选择当前交易近一个月内的交易行为记录做实时的聚合与特征抽取;选择当前交易近四个月或者更长时间的交易记录做线下预聚合与特征抽取,并对预估模块做定期更新及优化。

5.系统的高性能和高可用

平台架构在保证系统稳定性的同时,保证交易响应控制在限定的时间内。

三、风控决策一体化平台系统实现方案

在接入基于人工智能的风控决策平台之前,银行自有的系统仅包括电子渠道交易系统、主机数据实时下发系统和业务系统、数据系统这三大系统。在采用人工智能风控决策系统后,银行形成了运转流畅的反欺诈系统,这主要包括规则决策系统、自学习系统、模型实时预估服务和机器学习模型训练组件(如图3所示)。

图3 反欺诈系统逻辑架构

1.反欺诈模型训练

兴业银行信用卡中心的数据集市,按协商的方式、数据内容和格式要求,将建模所需要的数据以及交易欺诈侦测系统的后验欺诈数据导入到机器学习平台依赖的Hadoop上,并基于风控决策一体化平台,完成线下信用卡交易欺诈侦测模型的训练。

2.在线预估服务数据准备

机器学习平台通过该系统订阅Kafka实时的交易流水,将交易流水推送到风控决策一体化平台的智能缓存数据库,供预估服务实时获取静态和计算时序数据,进行特征工程使用。

3.在线预估服务开发与上线

风控决策一体化平台在线打分的预估服务通过API接口,对外提供调用接口,并基于约定算法进行在线计算,对交易欺诈侦测系统,以输出[0,1]的分数,协助进行交易的欺诈性判断和决策。同时预估服务会将收到的交易流水推送到Kafka系统,作为后续预估服务的历史交易流水使用。

4.在线预估服务的业务使用

业务通过交易渠道发起交易,发卡侧通过卡系统授权交易,将授权后的交易流水返回到交易欺诈侦测系统。交易欺诈侦测系统判断是否需要发送至风控决策一体化平台进行风险评分。如需要,交易欺诈侦测系统根据交易打分请求,调用风控决策一体化平台的预估服务进行风险评分。交易欺诈侦测系统将风险评分转化为具体控制措施(包括放行、告警、延迟执行、强认证、阻断等),将该结果发送给相关的业务系统进行后续处理。

5.模型自学习

风控决策一体化平台定期收集行内数据集市提供的自学习建模数据,包含账户主题明细表、卡片资料表、客户信息汇总表、产品表、卡片级指定商户交易开关表、欺诈交易标签表、交易流水表,根据自学习建模方案约定的数据周期范围进行定期训练,完成反欺诈模型的迭代和预估服务调用模型的替换。

四、风控决策一体化平台业务流程

基于机器学习模型和专家规则,风控决策一体化平台在交易发起后将进行实时决策,对其进行风控判断,若存在风险则进行实时阻断并对此次交易进行调查和分析,进而完成模型迭代和规则反哺,实现良性的闭环系统,即实现对风控决策的全生命周期管理(如图4所示)。

1.多元数据引入

针对不同场景预定义的数据流接入方式,同时支持结构化与非结构化数据,低饱和数据的消噪处理,提升数据可用性。

2.智能实时决策

交易流过程中的专家规则、机器学习模型双重监控,根据业务实际情况,支持实时模型预估与批量模型预估相结合的方式。与传统风控系统相比,风控决策一体化平台能实现高性能在线预估服务,这包括实时数据聚和、实时特征工程和实时预估计算,其能达到2000万维模型、能在20毫秒内响应,与之相比,传统风控系统模型维度小于2000万、响应时间约200毫秒。

3.基于业务预警配置

支持客户维度、交易维度、案件维度等多元的评分预警,可根据业务系统线上运行情况,实时调整预警阈值,风险可控。

4.案件管理分析

带有可解释性的机器学习模型,案件概要信息与关键风险点的对比,关键特征的定性查看。

5.数据分析迭代

闭环的机器学习自学习系统能自动调优,优化生产系统模型结果,风险大盘支持对案件、交易的分析和因果解释,独创的可解释模型对风险决策人员友好可见。增量自学习功能,能够在系统性能健壮稳定的前提下不断迭代模型,保持持续快速更新。

五、风控决策一体化平台业务成效

兴业银行风控决策一体化平台能实现高性能的实时欺诈交易侦测,单笔交易处理时长仅需20ms,其中99.9%的交易能在50ms内完成;在相同的召回率下平台准确率提升了6倍以上。其中,根据模型接入案件数据的持续反馈,以每月为频率,会自动迭代更新。

风控决策一体化平台的机器学习模型在不同覆盖率的情况下,准确率比照专家规则和传统模型都有了极大提升。在对高危欺诈交易的侦测上,机器学习的模型效果显著,甚至能将现有的对可疑交易的“事后反欺诈”(主要通过电话确认)转化为“事中反欺诈”(在交易进行过程中,直接终止交易,需要非常高的准确率),节省了银行的人力成本和运营投入。而在覆盖绝大多数交易欺诈交易的情况下,与专家规则结合的机器学习模型能够为银行带来数目可观的额外的防堵金额收益。与业界领先、训练数据庞大的国际卡组织提供的反欺诈解决方案相比,兴业银行风控决策一体化平台准确率更高。

未来随着机器学习模型与专家规则的深入结合,行内人员会逐渐减少更新传统专家规则的时间,将更多的精力放在优化机器学习模型上,使反欺诈模型达到最优效果。风控决策一体化平台通过人工智能技术对欺诈风险进行精准的预测和评估,能够协助金融机构及时发现、规避潜在欺诈风险,将引领金融领域反欺诈业务的智能化趋势。

文章来源:《中国金融电脑》2019年12期

声明:本文来自中国金融电脑,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。