作者:广东华兴银行 赵泽栋 谭柱钢 朱丹
近年来,伴随着金融科技的快速发展,银行的服务模式和服务场景日趋多样化,在给客户带来便捷的同时,面临着更加隐蔽、专业的欺诈风险。在当前互联网新兴技术不断发展的大背景下,如何借助大数据、人工智能等技术的支撑,更安全可靠地服务银行业务,成为商业银行反欺诈研究的重要课题。
一、反欺诈体系建设的背景和诉求
目前,行业主流反欺诈系统都是基于专家规则实现的,即根据业务专家经验对银行各个业务、各个渠道、各个操作步骤的分析结果,找出每一个流程中可能出现的风险点,设计相应的反欺诈防范规则,并根据实际场景和经验对阈值参数不断优化。然而,欺诈团伙为了获取更多的利益,往往通过各种技术手段分析绕过已知的专家规则进行欺诈活动。所以,传统基于专家规则的反欺诈方式往往具有较强的主观性和滞后性,无法提供实时高效的防护。
为了更加安全可靠地服务于业务发展和满足客户需求,银行迫切需要构建统一的风险可量化的智能化反欺诈体系,对客户、账户、交易、商户风险等反欺诈领域模型进行升级,全面提高反欺诈量化数据管理和应用能力,并提出以下几点诉求:
1.瞬时高并发、低延时的实时计算要求
随着银行业务的互联网化,系统在设计上需要考虑在高并发压力下不影响客户正常体验,并在极短的时间内快速完成风险计算并给出实时处置策略。
2.大规模、大数据量的动态计算要求
随着移动互联网的普及,数据量呈现爆发式增长,对大规模数据的实时计算需求越来越高,为确保客户的反欺诈模型能够动态快速调整,需要整体提高模型优化的响应速度。
3.有效学习并提升预警命中率的要求
由于欺诈性交易占所有交易次数的比例很低,因此反欺诈模型需要使用极精细、极复杂的挖掘技术,从海量数据中学习交易欺诈的行为特征和模式,从而有效提升系统预警正确率。
二、反欺诈体系建设探索
面对各种复杂的欺诈手段,银行需要在反欺诈的事前、事中、事后等多个环节中,根据各自不同的欺诈特性,部署不同的防线,建设立体的智能化反欺诈体系。
1.欺诈特征检测
欺诈特征检测是互联网反欺诈体系的基石,直接决定了互联网反欺诈体系的成败。常见的反欺诈特征监测又可以分为内部欺诈特征识别和外部欺诈情报监测两类。
在内部欺诈特征识别方面,银行可以通过安全SDK、设备指纹等欺诈特征监测产品,进行客户安全特征的监测,并通过安全加签、消息加密和人机识别等服务,保障业务数据传输的加密和安全。在交易防护过程中,可通过Rete算法的规则引擎,并结合分布式缓存技术,应对线上海量实时规则计算。另一方面,通过建立基于贝叶斯算法的异常行为分析模型及新欺诈持续发掘模型,保障模型的持续进化和有效性。
正所谓“知己知彼,百战不殆”,互联网反欺诈体系的建设,还需做好外部欺诈情报监测工作,即时刻保持对欺诈产业的关注,了解和掌握欺诈的最新套路和手段,并及时调整和完善自身的策略进行应对。商业银行应统筹规划反欺诈研发团队,并与业界顶尖安全企业或团队合作,依托外部专家资源分析欺诈产业,配合社会网络分析技术进行相关欺诈风险特征的研究。通过关联图谱构建知识图谱模型,挖掘欺诈产业信息,把已知的欺诈信息和未知的欺诈信息有效联系起来,发现数据之间的关联关系,以达到发现潜在的欺诈手段和团伙的目标,为新欺诈防控规则的制定提供参考依据。
2.欺诈监控指标
对于互联网反欺诈体系的建设,全面的欺诈监控指标建设是重中之重,直接决定了对反欺诈体系运转情况的实时监控有效性。在反欺诈指标建立方面,商业银行也有着自身的特点,主要包括以下几方面。
(1)客户类监控指标:侧重于客户行为监控,通过对客户行为有关数据进行统计、分析,抽象出单用户或群体用户的特征全貌,建立客户行为全景画像。
(2)账户类监控指标:侧重于账户分级监控,通过分析银行I、II、III类账户交易限额、账户权限、开户方式的差异性,对账户级操作进行分级分类监控,保障用户安全与便捷的平衡。
(3)交易类监控指标:侧重于全行电子渠道金融动账类交易的实时监控,例如防止交易欺诈、反洗钱等。
(4)商户类监控指标:侧重于对商户的行为进行监控,判断是否存在违规行为、套现、虚假交易等,也从另一个维度监控客户的账户,防止被盗刷等。
(5)策略类监控指标:侧重于对反欺诈策略和规则的触发情况进行实时关注,如反欺诈规则的拦截率、命中率、规则响应时长等,以达到对模型有效性进行分析及验证的目的。
3.欺诈风险处置
欺诈风险的处置策略和规则可用于明确欺诈风险的可接受水平与处置方式。商业银行采用的欺诈风险处置方式主要包括以下几个方面:
一是风险阻断,对于高级别疑似欺诈风险,通过制定反欺诈策略进行拦截和实时阻断。
二是加强验证,对于中级别疑似欺诈风险,通过牺牲用户体验来平衡风险水平,降低风险级别,例如上行短信二次验证、人工审核交易延迟完成等。
三是风险通知,对于低级别疑似欺诈风险,通过电话银行外呼、短信提醒等方式提醒客户。
四是事后欺诈调查,指对各渠道反馈回来的欺诈线索和案例进行人工调查与分析,对其中的欺诈行为进行认定,并对欺诈特征检测、欺诈风险处置和欺诈监控指标的效果进行评估。
三、智能化反欺诈平台的建设
1.分层构建系统架构
智能化反欺诈平台采用分层架构的设计模式,主要包括渠道接入板块、中间件板块、监控分析板块(实时监控中心、离线监控中心、处置中心)、大数据计算板块(Spark)、机器学习板块(Spark ML)及数据存储板块。整体架构具备敏捷开发性、易部署性、可测试性、高伸缩性、易开发性等优点。
(1)监控分析板块:主要提供API服务接入功能,包括广东华兴银行自研的基于Rete算法规则引擎分析、相似度比对、特征加工、模型加载预测、数据沉淀等功能,其中,为了不影响实时分析性能系统提供了在线实时交易监控与事后离线监控,监控中发现任何问题,会调用处置中心的银行外呼、短信提醒、临时止付等处置手段,渠道发送的实时流数据会通过在线服务层采用异步方式将数据按照基于时间片段的数据分片方式写入消息中心RabbitMQ中。
(2)中间件板块:采用RabbitMQ消息队列技术,为流式特征计算层和轨迹相似度判断提供数据缓存服务,采用Redis分布式缓存技术,对客户热点数据,常用数据进行缓存,加快响应速度,减轻数据库层压力。
(3)大数据计算板块:采用流式计算引擎对实时数据流进行实时分析,提供全渠道各项指标特征值,并结合全局指标进行整体风险监控,为决策提供支持。
(4)机器学习板块:传统的机器学习,一般为离线分析提取特征,隔日更新模型,建模耗时久,实效不高,因此我们采用了实时特征提取与离线模型训练相结合的模式。其中,实时特征提取通过流式计算引擎对实时数据流的特征进行加工,并按照模型特征逻辑进行数据加工,写入并沉淀到特征存储层,为离线模型训练提供特征数据;离线模型训练通过定时调度策略,周期性的批量读取特征存储层的特征数据,自动训练模型,并将训练好的模型写入到模型更新层HDFS。
(5)数据存储板块:提供关系型数据库(Oracle)与分布式数据库(HDFS)支持,关系型数据主要对规则引擎的配置信息、客户、账户等数据进行存储,分布式数据库用于存储流式计算后的模型训练特征,为模型训练提供拍照特征支持,存储批量更新后的模型,支撑在线预测服务实时模型更新,为整个智能化风控系统提供实时交易的防护。
智能化反欺诈平台的组件通讯采用消息驱动模式,异步处理,能提供高性能的实时处理能力。平台具备横向扩展和向外扩展能力,模型可以轻松复制到多个节点,且位置透明。同时基于Dubbo、Spark构建应用服务具备分布式计算能力,服务不受单个计算逻辑节点挂掉影响,同时基于并发模型,服务状态异常后具备自动恢复功能,保障系统7×24小时的高可用性。智能化风控系统架构如图1所示。
图1 智能化风控系统架构
2.人工智能在反欺诈领域的应用
(1)使用无监督学习构建客户画像
商业银行通过引入大数据深度学习技术,建立账户分级体系及客户行为画像,收集与分析App使用者设备属性、账号属性、网络属性、操作行为、交易模式、产品偏好等主要指标数据,通过贝叶斯聚类分析算法抽象出单用户或群体用户的特征全貌。在欺诈检测中,能够快速度量操作用户与真实合法用户的相似程度,为判断用户及行为合法性提供大数据依据,使得风险识别环节进一步前移,有效提升风险识别的前瞻性和对高风险交易的控制能力。
(2)通过人工智能认证异常检测模型代替人工标注
商业银行通过构建人工智能认证异常检测模型及欺诈新模式持续化发掘模型,利用人工智能反欺诈关联图谱提供的有效分析标注出犯罪团伙,并开展有效防护工作。人工智能认证异常检测模型可用于定义欺诈资源网络关联特征,如网络直径、网络图密度、模块化指数等,并通过关联基本特征、事件序列特征、事件窗口特征等构建用户画像知识、设备画像知识,最后通过异常检测模型降低人工标注工作量,减少风控人员的人力成本。
(3)构建智能反欺诈关联图谱
智能反欺诈关联图谱从资源(IP、设备指纹、账号、证件、银行卡等)和事件数据粒度分别构建关联图谱网络,结合用户画像模型、特征工程技术,通过相似度算法定义网络定点间关系,构建资源级别和事件数据级别图谱网络,发现大量数据中相关属性集之间的关联关系,目的在于发现潜在的欺诈团伙,为规则制定提供参考依据,优化智能化反欺诈的静态防护规则,在保证模型精度的基础上,最大限度提升模型召回率,降低误判率和漏判率,有效提升智能化反欺诈平台的预警命中率。
(4)新模式持续化挖掘模型进行有监督机器学习,智能调整规则
异常检测模型完成异常检测标注,在深度网络欺诈检测充分挖掘欺诈样本基础上,实现全量欺诈特征挖掘和已上线规则的阈值/权重动态学习,最终实现在线规则引擎预测结果在过拟合和欠拟合之间的权衡,欺诈新模型持续化发掘的方法为反欺诈的静态防护专家规则提供了及时有效的补充。
3.智能化反欺诈的未来研究方向
智能反欺诈的未来在一定程度上取决于人工智能的发展与研究。随着金融机构在半监督模型的逐步实施应用,标注数据不断积累,当积累到一定程度之后,可采用多种算法融合的策略,包括因子分解机FM、逻辑回归LR、支持向量机SVM等机器学习算法,以及深度学习算法DBN、卷积神经网络CNN等,从而使模型效果逐步达到最优,风险预测更精准。
同时,结合银行在技术、场景等方面的积累,把智能反欺诈系统打造成具备向外输出反欺诈能力的平台化产品,并通过API开放平台,以对外提供API接口的方式,将多年积累的反欺诈金融科技能力对外输出,也是商业银行在反欺诈领域的一种应用。
《中国金融电脑》2019年第 6 期
声明:本文来自中国金融电脑,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。