招商银行信息技术部 研发中心副总经理 夏雷
互联网为银行客户带来便利的同时,也给违法犯罪分子带来可乘之机。银行交易一路攀升的背后,是欺诈和反欺诈的刀光剑影,从未间断,且愈演愈烈。截至2018年10月,招商银行个人交易的93.6%来自互联网,5%来自线下自助设备。我们的反欺诈压力巨大,风控能力决定了我们的业务半径。
传统银行风控手段能走多远?
从早期的网上银行到今天的手机银行,银行积累了大量的风控手段,继续按原路径走下去是否可行?我们的结论是,现在已经到了必须变革的时候。原因在以下几点:
1.客户体验与传统风控存在重大矛盾。以前的风控措施往往是“前重后轻”,客户负担很重,银行负担相对较轻,把麻烦留给客户,把方便留给银行,本质上是以牺牲客户体验换取银行的风险可控。以银行业长期引以为荣的证书为例,客户需要申请、激活、更新,需要随身携带,需要电脑或手机兼容等等,不胜其烦。但是,证书的实际风控效果并不理想,进程注入、远程控制等作案手段仍大行其道,对受骗客户的本人操作更是没有效果。今天,习惯了互联网公司产品的客户,对银行的风控措施愈发难以忍受,银行继续坚持传统风控手段,几乎等同于抛弃客户。
2.反欺诈责任主体不明。以前的风控措施往往只把自己的职责范围定位在防伪冒上,即非客户本人操作。对于因欺诈造成的客户本人操作普遍关注度不高,本质上是把反欺诈责任推给了客户。坦率讲,诈骗分子的手段越来越高明,即使是专业人士也未必能保证自己不受骗,指望银行客户都能识别骗术更是天方夜谭。从社会责任看,虽不能靠银行堵截住所有诈骗,但作为社会资金的主要通道,银行应尽全力履行反欺诈义务。从商业竞争看,如果一家银行能够大幅降低客户的受骗概率,也就赢得了市场优势。
出于以上考虑,招行对新一代风控系统提出了具体目标:首先是尽量减少客户的麻烦,尽量不增加客户的设备成本和兼容性要求,因此我们的手机银行一开始就摒弃了证书方案。二是尽量简化客户操作,最好能做到客户对风控措施无感知,在静默中堵住每一个作案者,放行每一位合法客户。三是要把诈骗纳入控制范围,哪怕是由于客户自身过失造成的密码泄露,甚至受骗后主动转账,也要争取堵住资金损失。要达到这样的目标,方案几近惟一:基于客户行为的大数据风控。
新型风控有哪些技术挑战?
1.实时性。招行有亿级用户,哪怕只计算客户一个月的历史行为,大数据量的处理也是一个难题,而且还要求基本不影响交易。必须在100毫秒以内得出结果,否则将造成大面积的服务中断或堵塞,这些都要求新一代风控系统的架构与传统数仓不同。
2.风险特征的发现能力。在如此之大的数据量下,专家经验难以支撑,何况专家经验需要依赖对已知风险事件的分析,存在滞后性。在此客观挑战下,基于机器学习的智能风险特征发现是不得不走的路。
3.多渠道联动能力。当下的风险事件往往产业链化,从作案前的探索银行业务薄弱点,到作案时的伪冒欺诈交易,再到作案后的资金转移,分散在不同的人和渠道上,潜伏和作案之间的时间跨度很大,如果银行风控系统不能在被放大的时空环境下追踪线索,风控能力短板将非常明显。
4.风控策略的灵活调整能力。此挑战是针对市场上商品化的风控系统而言,这些系统调整策略确实简单,往往只需业务人员对参数作少量配置,如同傻瓜相机一般。对招行而言,这种没有源码级控制能力的傻瓜式风控系统缺乏灵活性和策略深度。
针对以上挑战,我们对新一代反欺诈平台技术架构的要求很明确:实时、智能、统一、灵活。
招行新一代反欺诈平台有哪些技术创新?
1.高维建模。主要针对传统风控系统特征发现能力偏弱的问题。反欺诈模型通过分析客户行为数据达到区分欺诈交易和正常交易的目的,传统分析思路通常采取抓大放小的策略,在特征值筛选过程中仅提取最具区分度的统计信息,放过大量弱相关信息。这样的策略,对于新型欺诈方式和长尾欺诈方式的识别能力是不足的,而放大数据的维度,往往能有效解决这个问题。
对每笔交易,目前我们能直接获取100个左右的变量,在这样偏低维向量表示的空间中,欺诈交易与正常交易的区分度并不明显。我们在直接变量的基础上,通过计算高阶变量、组合业务变量和细分结果分类的方法,把反欺诈系统的输入向量维度放大到2000个左右,风险特征的发现能力大大提高。
2.社区发现。主要针对风险事件机器学习中的监督学习困境问题。客户分类一直是风控系统的基础问题,最传统的方法是基于客户特征计算出客户标签,进步一些的是基于有标签客户的训练样本进行有监督的机器学习,但此方法会遇到客户标签依赖人工经验的问题和新标签不能自动产生的问题。招行借鉴聚类算法的思想,综合机器学习算法和业务特征算法,主要涉及特征工程、信任评分、图构建及社区发现四项技术,计算客户在高维空间中的距离,进而得到客户的聚集区,使得合法客户和非法客户在高维空间中明显可分,新出现的异常行为也会在高维空间中表现为离群点而被自动发现。
3.迁移学习。主要针对机器学习的风险事件数量不足问题。我们的主要欺诈事件来自互联网,但相比海量的合法交易事件,欺诈事件数量微不足道,对机器学习而言训练样本数据太少,不是一个好的应用环境。针对此问题,我们补充了线下POS刷卡数据,同时采用基于样本的迁移学习和基于特征的迁移学习方法,捕获了线下线上的一些共性风险特征,最终使风险事件发现召回率得到个位数的提升。
4.生物探针。前述技术特性都是以银行端记录的客户行为数据为基础,偏向客户行为的宏观表达。但实际上,在手机银行客户端可以发现客户行为的微观表达,以更细的粒度去刻画客户,在风控效果上也更明显。我们的思路是记录客户的手在手机银行上的操作信息,如按压力度、移动速度、倾斜角度等等,对每一个客户操作的细微特征建模,从而区分本人还是非本人操作。实践结果表明,客户的微观操作行为差异很大,这样的生物识别区分度非常明显。相对于人脸识别、指纹识别这些常规生物识别手段,我们的生物探针真正做到了客户无感知的身份鉴定,完全不干扰客户体验。
新一代反欺诈平台的实效如何?
招行自2015年开始投入大量人力物力,基于大数据及人工智能技术建设新一代实时智能反欺诈平台。目前,每天平均访问量约5000万笔,平均响应时间30ms。2017年第一季度上线后,我行否认交易笔数较去年同期下降82.11%,否认金额BP同比下降96.40%,客户整体资损率约1%,显著优于银行业万分之1.99的平均资损率。风险案件得到了有效遏制,社会经济效益显著。
此外,新平台也带来了客户体验的明显改善。基于平台对每笔交易的风险判断,我们对低风险交易降低核身要求,大大减少了短信验证码、人脸识别等高门槛核身操作,同时安全性更高。以最常见的短信验证码为例,由原先的笔笔验证码变成了目前的仅15%需要验证码,而登录仅5%需验证码,客户操作更为流畅。
新一代反欺诈平台支撑了我们今天的业务,但未来仍然面临诸多挑战。更高的系统可用性,更大的数据处理能力、更敏锐的风险特征发现算法等等,都是我们的目标。网络攻防是一场永无终场的战争。
声明:本文来自金融电子化,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。