文 / 中国农业发展银行信息科技部 李小庆
当前,科技与金融的深度融合,不断推动银行业务模式和服务方式创新。银行作为金融科技应用较为深入的行业,数据积累时间长、体量大,同时,在业务经营管理过程中引入了大量的外部数据,形成了银行大数据。为保障数据质量,需要深入开展大数据治理,使数据能准确、清晰地反映业务经营管理过程和成果,为银行优化客户服务、创新金融产品、开展风险管理提供更加有力的决策支持,从而充分发挥大数据资产价值,推动银行高质量发展。
一、大数据治理内涵和特点
目前,银行在大数据质量、管理等方面还存在诸多问题,只有通过大数据治理,形成具有标准统一、涵义一致、质量更高的大数据,才能让数据不断创造价值。
1. 大数据治理内涵
银行大数据治理主要涵义是为持续保障数据质量、数据可获得性和数据安全性而建立的一套数据管理措施,包括一系列从源数据采集到信息供应的、端到端的大数据管理政策、工作流程和所采取的控制措施。通过组织人员、流程和技术的相互协作,对大数据从形态、内容和关系等层面进行规范管理,以提升大数据服务能力,实现大数据价值最大化。
2. 大数据治理特点
大数据的特点是数量大、类型多、变化快、价值密度低,大数据治理工作主要有以下特点。
一是治理主体涉及内部和外部。大数据不仅包含内部结构化数据,同时包含了引进的各类半结构化、非结构化的数据,大数据治理主体不再限于银行本身,外部数据治理要与数据产生方的机构协同开展,从数据的源头或引进时就进行管理,引进后按照相关的标准或规则进行清洗、整合和转换。
二是治理的内容更加广泛。传统数据治理对象主要是金融的内部数据,而大数据应用非常广泛,包括从外部引进的工商、税务、司法等行政信息,具有多样性广泛性的特点,既有宏观信息、行业信息、产业信息,也有客户经营活动信息。在数据治理过程中要深入理解这些数据的具体内容和代表的含义,有针对性地制定治理方法和途径。
三是治理的方式更加多样。传统数据治理的对象主要是结构化数据,按照金融模型分为参与方、信息、产品、渠道、财务等多类主题,基本涵盖了银行的全部数据内容。而大数据治理的对象更加多样,包括客户生产、生活、社交等方面的信息,还有很多非结构化数据,特别是涉及客户行为等数据变化快、类型多,要“因数制宜” 地开展治理活动。
四是治理的侧重点有所不同。探索数据治理是建立统一的数据标准、数据架构和数据质量管控机制,持续提高数据质量,达到类似“书同文、车同轨”的效果。大数据治理过程中面临多元数据源的采集、外部数据引入转化等新的情况,治理时需要内外兼顾,重点关注外部数据的转换,与内部信息有效融合,使其能够和内部数据相互交互,形成一致的数据视图。
二、大数据治理体系框架
大数据治理活动就是在责任清晰的前提下,为开展数据的有效利用和数据价值的充分发挥开展的一系列面向业务政策、流程、管理工具相结合的实践活动,其本质是对大数据进行体系化的质量管控、推进和提升。大数据治理体系涉及治理战略、治理组织、治理主题等, 体现在大数据标准、大数据质量、大数据生命周期等各个领域,需要从数据战略和规划、数据政策和制度、数据组织和流程等方面有效地开展,并从大数据标准等相关治理领域有序地推进,银行大数据治理体系如图1 所示。
图1 银行大数据治理体系
1. 大数据标准
大数据标准是针对银行内外各种重要、共享类数据, 经协商一致制定并由银行主管机构审核发布,供各级行各部门遵循使用的规范性标准约定,既包括传统的结构化数据标准,也包括半结构化数据标准和非结构化数据的标准约定,目的是在全行范围内对内部和外部转换的数据统一业务口径,对关键数据达成一致理解,避免出现数据歧义,确保大数据资产在交换和使用过程中具有高度的一致性与准确性。
2. 大数据质量
大数据质量是指数据满足业务运行、经营管理与决策的程度,主要从真实性、准确性、连续性、完整性和及时性等多个维度对大数据进行准确度量,开展量化管理。由于外部数据来源多样、类型不一,引入时需要识别关键外部数据,并统一纳入数据质量管控。通过对大数据质量进行监测、问题发现和整改,形成数据质量的闭环管理机制,杜绝质量问题再次发生, 实现事前防范、事中监控、事后处理的全面质量管控流程。
3. 主数据
主数据是用来描述银行关键业务实体的数据,比如客户、机构、员工、产品等数据,具有较高的业务价值,能在银行范围内跨业务条线重复使用。对于引入的外部数据,要根据其特点确定一定的转换规则,对外部数据进行转换解析之后与内部数据进行关联融合,在此基础上建立统一的主数据视图,形成跨内外部数据、跨业务领域统一共享的主数据,建立主数据发布、共享和维护机制,确保银行获得准确、一致和完整的关键信息。
4. 元数据
元数据是描述大数据的数据,包括业务元数据、技术元数据和管理元数据。元数据为大数据提供内外部、上下游关系,实现数据的血缘分析、追溯分析和影响分析,增加信息的透明度,通过建立元数据模型,可对内部数据和外部数据的元数据进行有效管理,并及时更新维护,为大数据治理领域提供良好的基础支撑。
5. 大数据架构
大数据架构关注大数据在企业中的部署结构,包括内外部数据关联情况及数据在各应用中的分布情况、内部数据和外部数据的关联关系、数据相互间的流转情况。目的是确立可信数据源,避免信息孤岛,消除不必要的数据冗余,增强数据的一致性、准确性,使数据得到更加有效的共享和利用。
6. 大数据分析模型
大数据分析模型是数据特征的抽象表现形式,是管理数据的形式框架。通过对业务运营所需数据进行全面梳理,根据一定的规则对业务概念或内外部数据进行逻辑化、抽象化、一致化的分类,用于指导或规范大数据需求提出、应用数据结构设计,进而为企业级大数据治理奠定基础。
7. 大数据生命周期
大数据生命周期是大数据从产生到销毁的全过程, 包括大数据的采集、创建、使用、归档和销毁。目的是在整个生命周期能够根据业务需求对数据进行及时、有效地访问,提高数据服务效率、降低数据获取成本,减少合规风险,确保数据在整个生命周期中的完整性。
8. 大数据安全
大数据安全是指对大数据进行控制以防其被偶然或蓄意地泄露、破坏而带来不良后果。通过确定大数据安全级别,设置大数据安全规则或策略,在数据访问、数据传输、数据存储和数据流转使用等各个环节对其进行控制和保护,更好地满足监管合规和信息安全的要求。
三、大数据治理实施路径
大数据治理涉及多个领域和维度,部门之间协调有难度,内外部存在管理隔阂,推进优先级难以分清,实施存在一定的困难。在实际实施过程中,应将“自上而下” 和“自下而上”相结合,抓住关键任务和关键问题,建立清晰的大数据治理组织,明确大数据治理主体,制定完善大数据标准,建立大数据质量管理机制,加强大数据生命周期的全过程管理。
1. 建立大数据治理机制
建立董事会、监事会、高级管理层、相关部门和各级行参与的多层次相互衔接治理机制,明确每一层级的大数据治理责任。在全行统筹层面设立大数据治理委员会,负责建立大数据治理体系,配置大数据治理资源, 制定和实施问责与激励机制,建立大数据质量控制机制, 组织评估大数据治理的有效性和执行情况。在组织协调层面设立大数据治理管理部门,设置大数据治理办公室, 负责实施数据治理体系建设,协调落实数据管理运行机制,组织推动数据在经营管理流程中发挥作用。在实施层面设立大数据治理小组,具体推动大数据治理工作全面落实。通过建立有效的大数据治理体系,优化形成良好的治理工作决策、协调、沟通、监测、评估、考核和提升良性机制,有序地推进大数据治理工作。
2. 制定大数据标准
在引入外部数据基础上,根据银行的业务经营管理需要,面向大数据分析和应用,深入分析客户、渠道、产品、合约、事件等关键数据要素,对外部数据进行有效转换,形成涵盖机构类、员工类、客户类、渠道类、产品类、营销类、账户类、外部类等在内的大数据标准体系框架,制定并发布全行视角的企业级结构化、非结构化数据标准和指标数据标准,充分满足经营管理和决策分析的需要,并在实践当中不断完善和丰富标准内容, 形成定期优化、更新、发布和实施的机制。建立大数据标准和主要信息系统数据与外部引进数据的映射关系, 推动标准分层次、分步骤地实施。
3. 提升大数据质量
通过建立大数据质量管控机制,以治理体系为基础、以组织架构为保障,以流程制度为依据,明确责任主体, 建立“监测—整改—跟踪—评价”的数据质量管理模式, 遵循“发现问题—分析原因—落实整改”的路径进行持续整改,建立“横向评价、纵向考核”机制,横向基于数据质量报告,定期通报各部门数据质量管理工作进展, 纵向对分行数据质量进行考核,将质量管控责任压实, 通过全行层面协同发力,稳步推进解决大数据标准和质量等一系列的根本性问题,做到标本兼治,形成管控的长效机制,全面提升全行数据的准确性、全面性和一致性,降低大数据管理成本,提升大数据质量,避免因为数据不准确、质量不高而导致决策偏离。
4. 推进智能数据管控
充分利用人工智能技术,建立智能数据管控平台,建立数据质量智能检核模型,合理选取训练数据样本, 融入机器学习、深度学习算法,提取数据质量问题的公共特征,通过不断自我学习,丰富质量检核规则,快速定位数据质量,提升数据质量管控能力。在数据存储、处理过程当中,利用时间序列算法建立分析模型,分析数据处理时序情况,对没有及时按时序处理的数据作出预警提示。同时利用语义分析等对客户的地址、单位名称等文本实现进行分析,甄别数据的一致性,提供数据质量问题线索,及时定位解决问题。
5. 加强大数据全生命周期管理
按照“用数据说话、任数据决策”的要求,从管理、科技、业务三个方面建立数据质量管控机制,将大数据治理融入信息化建设全流程,在需求管理、模型设计、投产交付等信息系统建设的每一个环节,融入大数据标准落标、大数据模型设计和大数据质量检核,从源头开展大数据治理工作,在数据创建、存储环节增加数据整合清洗、质量准入检核等工作,在数据处理和使用环节加强全流程的数据质量监控,实施自动化、可视化的数据质量监测和分析,使大数据能够全面、准确、有效地反映银行的真实经营信息和客户各维度信息。
6. 加强大数据安全管理
建议从国家层面健全适应大数据发展的法律法规体系,规定大数据的所有权、使用权等权利归属以及安全隐私保护规则。从金融政策层面制定一套适合金融行业的安全管理体系,加强顶层设计,完善大数据安全技术标准和保障机制,实现金融大数据的安全合规和共享使用。从银行层面根据自身情况制定大数据的采集、处理、存储、流转、使用和销毁等全流程管理制度规范,明确大数据在产生使用过程安全控制标准、机制和流程。
四、充分发挥大数据资产价值
大数据治理的关键是发挥大数据资产价值,因此价值管理成为大数据治理的主要目标,大数据形成之后, 可基于“一体两翼”的思路建设数字化服务能力:“一体” 就是建立全行企业级大数据平台;“左翼”为建设三个层次,即算力层、算法层和服务层,将数据和服务充分连接;“右翼”服务银行前、中、后台业务部门各类业务场景,对业务经营管理进行赋能,全面提升客户关系管理等方面的分析决策能力,为推动银行数字化转型奠定基础。
一是提升客户关系管理能力。通过对客户的经营特征、履约情况、信用情况、行为特征、商品交易、关系网络等多维度数据进行整合处理,聚合形成全方位的大客户数据,实现对客户精准画像、多维分析,提升在客户营销、客户维系、客户挽留等业务场景下精准客户关系管理能力。
二是提升智能客户服务能力。基于大数据打造综合化、一站式客户服务平台,建立扁平化、快捷、线上线下协同的服务模式,支持全渠道统一客户体验,统一服务方式、有效协同,为客户提供端到端的服务体验,实现组织架构优化重组,客户服务流程重塑。
三是提升金融产品创新能力。基于大数据分析客户的特征、需求和风险偏好,打造个性化的金融产品或投资组合,加大基于信用的金融产品设计,设计股东信用保证贷款、订单融资等创新信贷产品,丰富多层次的金融产品体系。
四是提升金融产品定价能力。综合分析客户的信用、能力和还款意愿等因素,在实践中提炼出能反映经济、区域、产业、经营、能力等情况的指标,基于大数据技术建立科学的定价模型,面对不同的区域、不同的客户企业和相关风险情况,对金融产品进行科学的定价。
五是提升风险管理能力。基于大数据建立企业风险评估模型,利用大数据样本进行学习训练,完善企业风险评估模型参数,科学评估企业的信用风险,综合分析判断企业的发展能力、抵受风险能力和偿债能力,对蕴含的风险进行预测,对贷后的企业经营发展进行动态监测,及时发现风险并进行预警,采取干预措施,有效控制风险。
本文刊于《中国金融电脑》2021年06期
声明:本文来自FCC30+,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。