互联网领域的欺诈风险范围相对集中,风险因素多来源于不法分子的恶意利己操作,系统安全规则不完善、相关信息易泄露的领域更易遭受风险。作为一家互联网银行,江苏苏宁银行从成立之初就高度重视反欺诈工作,本文着重讲述基于大数据的金融反欺诈系统建设情况及展望。
自2017年,我行开始自主研发反欺诈系统,该系统实现了全业务、全流程的安全保障,覆盖交易的事前、事中和事后监控。从设备环境、交易位置、行为轨迹、关系网络、可信体系、交易习惯6个维度,全方位扫描交易风险。经过3年努力,反欺诈系统已经打通线上全场景,包括开户、注册、登录、抽奖、支付等200多个场景,并创新运用到对公账户风险管控和反洗钱领域,现已形成一整套反欺诈管理体系,包括支付反欺诈、账户反欺诈、营销反欺诈、对公反欺诈四大体系,为我行近3000万客户的资金交易提供了安全防护。
江苏苏宁银行首席信息官 黄进
自主研发,安全可控
考虑到本行业务的线上化特点,系统设计要满足高并发、灵活配置、实时响应、实时计算和安全可控等特点。我行自主研发了实时规则引擎,规则和配置均实时生效,在架构上采用REDIS作为缓存数据库,MYSQL作为关系型数据库,采用KAFKA作为消息中间件,运用可扩展、高可靠、低延迟的实时流处理框架FLINK作为实时计算引擎。系统功能设计上具有事件管理、规则管理、侦测记录查询、案件库、风险特征库等核心功能。该系统提供7×24小时服务,累计供应风控侦测服务超5亿次,监控交易金额过万亿。该系统日均扫描60万笔交易,每秒支持1000笔交易的风险识别,每笔交易50毫秒内完成风险判断和处置决策,异常交易成功识别率在99%以上。在如此活跃的交易量下,涉及用户打扰的风控仅为1/100000左右,做到了静默监控。
在知识产权方面,我行已经申请反欺诈相关专利9项(已授权4项,含发明专利1项),发表软件著作权3件。
场景互通,锤炼交易“金钟罩”
传统风控系统只给前端调用系统返回是否通过等信息,我行的智能风控系统打通了前端系统的动作中枢。例如,对于有风险的客户会要求前端系统进行人脸、视频等加强验证动作,实现中台与前台系统的快速联动。
随着存贷款产品等多元化业务类型的新增及开放银行的上线,客群分布呈现出复杂多样性,业务量、用户量都出现短期暴增,我行风控能力面临巨大挑战。2018年起,苏宁银行要求所有新产品和新业务都需接入反欺诈系统。截至2020年12月,反欺诈系统已经对接全行15个系统,如微信银行、手机银行、卡系统、开放银行、统一支付系统、柜面系统、移动展业系统等,共接入115个侦测事件,覆盖全行200多个场景,日均侦测笔数达到60万笔,单笔平均耗时50毫秒。所有侦测结果均会实时返回场景端,除返回通过和拒绝外,所有加强验证方式均由反欺诈系统返回,如短信验证码、人脸识别、空间验证码、视频认证、密码验证等。每个客户的返回动作是反欺诈系统据其风险情况、可信特征等进行实时计算而得出,做到“千人千面”。
2020年,我行在反洗钱实时化和反欺诈在对公领域的应用方面进行了探索。在反洗钱领域运用实时计算能力,在反欺诈系统上部署大额和资金频繁进出的反洗钱规则。目前已经研发大额资金进出、多卡多行转入、出入金金额相似等反洗钱合规规则,触碰该类规则的客户会进入案件库,相关部门会及时对客进行KYC调查,并依据监管要求实施账户管控等措施。在对公反欺诈领域,我行围绕反欺诈的事前、事中及事后环节,结合账户管理实际情况,制定对公反欺诈防范重点。事前即开户环节,主要进行客户身份识别、空壳公司识别及风险数据筛查。事中即账户存续期间,主要进行客户信息的动态监测、交易监测及团伙欺诈识别。事后即反欺诈能力的持续提升,包括数据积累、模型优化及外部环境监测应对等。
大数据赋能,打造风控大脑
系统运行初期,规则数据都是实时引擎累计的指标,如24小时同一IP登录次数、24小时同一设备号注册次数等,反欺诈规则采用专家模型,无法精准拦截交易,且实时计算引擎只能计算24小时内的指标。为解决这一痛点并丰富反欺诈数据源,我行于2019年建设了反欺诈风险数据集市,其中数据分三部分:一是与生态合作伙伴数据互通,以标签形式为我行提供基础数据服务,如黄牛、疑似中介、交易可疑行为等标签。二是为丰富客户行为数据,集市采集了数据仓库的O层数据作为补充,如客户中心、统一支付数据、理财系统等。三是反欺诈系统历史数据,反欺诈风控集市建设离线指标库、可信体系、设备库、监控报表等大数据应用。
2020年我行还建设了反欺诈情报图谱系统,基于反欺诈积累的海量、多元数据,依托数据挖掘、图形学、关系推理、图数据库等先进技术,构建了用户关系网络。传统的反欺诈分析检索直接关联关系型数据库,分析案件深度有限,且需指定关系类型,无法直观获取全维度的整体信息。图谱系统可以精准挖掘所有与目标节点有直接或间接关系的关键信息,如手机号、设备号、银行卡号、身份证号,建立一套完整的案件画像,从而定位核心作案人员和其他疑似欺诈分子。
人工智能加持,提升风险识别能力
欺诈风险特征错综复杂,仅靠人工经验无法面面俱到。我行利用特征工程和无监督的机器学习方法,对风险特征进行自动识别,寻找欺诈的蛛丝马迹。在反欺诈数据集市中,按照主题维度进行数据清洗,如客户画像主题、客户行为主题、客户设备主题等,通过随机采用和分层抽样的方法形成样本数据,利用归一化、one-hot编码、TF-IDF等方法,对不同类型数据进行转换处理并提取原始特征,利用GBDT产出特征组合路径,形成组合特征,并将原始特征和组合特征共同纳入训练集,最终训练出可应用于实际风控策略的有效反欺诈特征。
未来展望
我行将继续深化“科技驱动”经营理念,在反欺诈领域不断深耕,利用图技术自动挖掘欺诈团伙、黑产、虚假裂变等。
升级迭代反欺诈系统功能,引入多规则组概念,多组并行执行。一个运行组输出结果,其余组可做为竞争组或备用组,如竞争组、大促组、草稿组等,当满足预定条件时,数秒内自动完成整组策略的切换。建设自动驾驶,基于参数取值分布,规则命中情况,结合多模式规则组功能,自动完成规则阈值调整、规则上下线推荐、规则组切换,自动适配当前风险形势。
2021年,我行将结合反欺诈情报图谱系统探索图预测技术,即利用图神经网络技术,将图数据结构与神经网络结合,学习数据内在关系后,对未知数据进行预测,并利用图嵌入技术,将图分析、图预测的中间特征变量输出,作为图的特征向量表示,成为下游任务输入特征之一。
图 风险侦测系统架构
声明:本文来自金融电子化,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。