文 / 中国银联技术开发中心 王荣海 林芃 杨帆

人工智能时代的到来,给支付风控领域带来了全新的机遇和挑战。面对层出不穷的欺诈风险和不断翻新的欺诈手段,传统的规则式风控方法有着难以处理海量数据、对弱特征不敏感、分析覆盖范围窄等种种弊端。而机器学习等人工智能技术在风控场景的深度应用,可大幅提升数据处理能力和风险识别准确性,巩固金融系统的安全与稳定。中国银联实时交易风险计量评分系统基于多维度大数据分析,形成交易的档案和特征值,随后通过精准的预测模型,计算交易风险并通过分数量化地提示发生风险的概率。通过对成员机构的交易实时地提供风险评分,帮助金融机构将欺诈风险拒之门外。

银行反欺诈面临的挑战

1. 欺诈风险形势复杂多变

科技的迅猛发展对金融产业的发展起到了巨大的促进作用,但经济犯罪也随之呈现多发态势,犯罪形态从原先的零星个案向更加智能化、团伙化、专业化和国际化转变。中国通信院发布的《移动数字金融与电子商务反欺诈白皮书》显示,我国黑产从业人数已超500万,每年涉及金额达千亿级别,欺诈黑产已形成成熟的独立产业链。尤其在资金、物流、信息流动规模空前的当下,各类风险交织融合,会进一步加剧风险的传导效应,威胁群众的财产安全和国家经济的平稳健康发展。

2. 单银行风控易受数据视角局限

尽管商业银行通常都具备反欺诈系统,但各银行间各自为战,存在数据壁垒,无法及时有效地应对欺诈风险的新形势。目前,许多欺诈黑产从业者已从独立个体转为团伙行动,欺诈行为常常涉及多个银行,但在某一家银行发生欺诈后,其它银行往往无法在第一时间感知,导致损失扩大。同时,独立的一家银行难以感知一些特征的全貌,例如单个银行通常只能获取到商户的一部分交易信息,无法精准描画商户风险。另外,欺诈侦测场景中正负样比例悬殊,单个银行往往缺少足够的欺诈样本建立模型。因此,单银行的实时风控系统在实时拦截准确率上、尤其是实时拦截首笔欺诈交易方面常存在瓶颈。

银联实时交易风险计量评分系统助力风控决策

中国银联拥有自身海量交易记录和长期积累的风险数据,基于银联大数据平台和人工智能模型训练平台,运用有监督机器学习算法,可对欺诈风险进行精准建模。同时研发实时流式计算引擎,能在毫秒级时间完成特征计算和模型预测。通过交易报文实现评分结果的传递与应用,可帮助发卡银行提升实时反欺诈防控与决策能力,将团伙欺诈行为在早期扼杀,是支付行业内首个实时跨行交易评分服务。

1. 建设大数据流式处理架构

交易风险计量评分系统从结构上可划分为七个子系统:通讯接入子系统、评分服务子系统、实时计算子系统、历史档案统计子系统、响应式批量子系统、数据采集子系统和数据持久化子系统。七个子系统分布于不同的物理主机上,通过缓存数据库、关系数据库、网络进行数据传输,完成协同工作。其中,实时计算子系统和历史档案统计子系统负责进行交易数据的分析和特征统计,通讯接入子系统负责外部系统入口适配并提供对外服务,评分服务子系统负责各类交易维度的特征聚合以及智能模型预测,响应式批量子系统负责外部系统和数据库之间的数据交互,数据采集子系统和数据持久化子系统分别负责交易采集分发和交易预测结果持久化。各个子系统的核心功能均可以单独运行,子系统的功能相辅相成。对于大型发卡机构,在通过银联进行跨行交易处理时,交易风险计量评分系统会将风险评分实时传递给转接系统,再透传给发卡机构,由发卡机构决策风险。

因为交易风险计量评分系统直接和中国银联转接系统对接,对系统“五高”,即高性能、高灵活性、高可靠性、高可扩展性和高安全性有严格要求。交易风险计量评分系统采用了全内存模式的快速缓存中间件,保证存取效率最大化;系统优化了传统的模型预测接口,在内部实现树结构,并用多线程方式重写了模型树的预测算法,保证了单节点模型决策运算速度的最大化;此外,系统采用了超高吞吐量且低延时的成熟流计算引擎计算短时特征变量,确保特征计算的时效性和准确性。

在数据存储方面,系统采用了双活主备机制,当主节点宕机时可以自动切换到备节点,且数据会自动备份;系统应用节点通过分布式协调服务实现高可用,节点注册服务到分布式协调集群,集群自动感知节点是否可达,上线可用的服务节点,下线不可用的服务节点;所有的消息队列中间件、缓存中间件、分布式协调中间件、流计算引擎均以集群模式构建,每个集群都有独立的高可用机制。

2. 训练基于机器学习的评分模型

依托银联海量的交易数据,系统从发卡行报送的交易流水、卡片统计、商户统计、地区特征、风险事件、欺诈样本等数据中,利用大数据及机器学习建模技术,构建与欺诈相关的特征体系,完成数据清洗和特征工程。基于构建的特征体系,通过人工智能技术——有监督的机器学习算法,经过多轮迭代训练得到模型。

针对反欺诈场景样本比例极其悬殊的技术难点,基于特征相似度对非欺诈交易进行降采样,保留欺诈样本数据并同时拉近正负样本比例,从而降低学习难度并能提升建模效率。针对特征代表性可能随时间推移逐渐下降的问题,对特征稳定性、相似度、区分度等多维度进行分析,使得特征能更长效地区分欺诈与非欺诈交易。同时,银联可在多维度范围内分析网络历史欺诈形势,为模型带来更好的泛化能力。模型的预测结果通过分数量化地提示发生风险的概率,评分值越高,表明欺诈发生的概率越大,可有效帮助成员机构防范交易欺诈、精细化管理风险交易。

3. 打造基于银联云的弹性多层分布式系统

基于银联云服务,交易风险计量评分系统采用多层架构部署,同时保持分层简洁,减少服务调用次数,减少跨机调用次数。系统各应用层均完全无状态化,每层节点均衡负载。系统每层之间、层内部之间松耦合,横向、纵向扩展方便。

对于特征计算过程中的短时和长时特征变量,系统采用异步流式计算和大数据计算,计算中间结果提前准备到分布式缓存,尽可能减少评分过程中IO次数。特征计算的中间结果和最终结果采用异步计算与同步计算相结合的执行策略,保证特征计算准确的同时,尽可能减少评分过程中计算复杂性。

系统针对机器学习分类模型,量身定制开发了实时评分模型引擎,对一笔交易模型引擎内部进行并发预测,并能够根据机器计算资源动态调整并发能力,能大大降低一笔交易模型预测的时间,并且保证模型预测的时间不随模型复杂度增加线性增长。

成果与展望

中国银联实时交易风险计量评分系统依托于银联海量数据和在人工智能、大数据领域技术实力,针对欺诈交易构建了智能评分模型,评分准确率较传统专家规则有明显提升。智能评分服务不仅没有改变成员机构自主决策风险的核心地位,而且通过使用银联的风险计量评分,成员机构能够更加准确并且精细化地实时控制风险,对不同的风险概率采用不同的风险防控措施。中国银联依托卡组织平台化的风险服务能力,真正帮助成员机构实现了对风险的有效和精细化控制。按系统建设下一步规划,交易风险计量评分系统将运用于银联全球网络跨机构交易,未来可为更多国家和地区的发卡银行及持卡人提供更加全面的保护。

声明:本文来自金融电子化,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。