中国人民银行济南分行副行长 刘振海

文 / 中国人民银行济南分行副行长 刘振海

中国人民银行济南分行 马征 缪凯

随着大数据技术的应用,越来越多的金融企业也开始投身到大数据应用实践中。麦肯锡的一份研究显示,金融业在大数据价值潜力指数中排名第一。本文通过对大数据在金融行业的应用现状进行分析,提出金融行业大数据未来发展思路及政策建议。

金融大数据应用政策和市场推动历程

美国作为大数据技术的发源地,大数据发展一直引领全球。2000年以来,美国针对数据的收集、管理、使用和发布等进行了一系列规定。2009年,推出政府数据开放平台“Data.gov”。2012年3月,公布《大数据研究与开发计划》。2014年5月,发布全球“大数据”白皮书《大数据:抓住机遇、守护价值》。英国紧随美国大数据战略,于2013年投资1.89亿英镑发展大数据。2015年,增加7300万英镑创建“data.gov.uk”开放共享政府数据。

自2014年我国首次将“大数据”写入《政府工作报告》,以及2015年国务院印发《促进大数据发展行动纲要》后,大数据已成为国家发展重要着力点。2017年,工信部正式对外发布《2016~2020年大数据产业发展规划》,提出到2020年,基本形成技术先进、应用繁荣、保障有力的大数据产业体系。麦肯锡的一份研究显示:无论是应用潜力还是投资规模,金融业都是大数据应用的重点行业。在全球金融监管趋严、同业竞争激烈、数据规模爆发式增长的形势下,金融机构纷纷借助大数据提升业务处理水平。

金融大数据应用优势

1.数据量大。金融业是数据密集型行业,对数据强依赖。以银行业为例,100万元的创收平均会产生130GB的数据,数据成为金融机构的核心资产。在不断增长的海量数据背景下,采用具有更有弹性的计算、存储扩展能力的分布式计算技术成为必然选择。

2.数据质量高。与其他行业相比,金融数据逻辑性强,要求具有更高的实时性、安全性和稳定性。而且无论对于个人还是企业,金融数据都是核心敏感数据。金融行业核心实时交易系统数据要求强一致性,正常状态下数据错误率为零,金融业开展大数据应用时,数据清洗环节将较为简单。

3.结构化数据占比高。当前,企业级数据结构化数据占比77%,而互联网数据结构化数据仅占5%。结构化数据与非结构化数据相比,在分析工具成熟度方面具有明显优势。后期,随着传统金融机构不断拓展互联网业务、远程业务办理、无人营业网点、机器人大堂经理等现代金融科技的不断丰富演进,金融行业的半结构化数据和非结构化数据占比将快速增长。

4.应用场景广泛、潜力大。大数据在金融行业有众多应用场景,包括精准营销、风险控制、客户关系管理、反欺诈检测、反洗钱检测、决策支持、股票预测、宏观经济分析与预测等方面。通过大数据应用,金融机构可开展精准营销,提升风控准确性、降低风控成本、增加用户粘性、改善客户体验,增强服务敏捷性。

金融大数据应用面临的挑战

1.数据孤岛现象严重。在金融机构内部,职能部门、业务条线和风控部门之间缺少数据共享机制,无统一规划,系统建设自由蔓延式扩展。烟囱式系统建设导致各部门业务系统相互独立,形成大大小小的数据孤岛。受样本量和数据维度的限制,各类大数据分析方法难以有效发挥作用。

2.复合型大数据人才短缺。大数据是新兴交叉学科,对人才的复合型能力要求高,既需掌握软件开发技术,并要具备统计学、数据挖掘以及应用领域的业务知识。目前大数据应用人才处于紧缺状态,如何加快大数据人才的培养和引进是值得金融业思考的一个问题。

3.数据安全和个人隐私保护更加困难。大数据时代的数据共享带来数据不可控、数据泄密等问题,关于涉及用户隐私和权益的数据类别界定,还需法律进一步细化明确。另外,大数据数据量大且集中,一旦遭遇网络攻击或窃取,将使数据安全面临更大的挑战。

4.金融业外部数据利用率较低。当前,金融机构大部分可利用数据依然是传统业务产生的数据,而外部数据,如税收、保险、公共缴费等数据源尚需进一步拓宽,这就需要更高层面的统筹协调,支持更为全面的数据分析与利用。

大数据应用政策建议

1.加快制定金融大数据标准,推动统一金融大数据平台建设应用。目前,行业间数据自成体系,就金融业内部看,银行、证券和保险标准规范也不统一。为利用大数据防范系统性风险,需加强顶层设计,尽快制定金融业元数据、数据交换、安全保密、数据质量等标准。逐步实现金融机构内、行业内和行业间的数据开放共享,推动以金融业综合统计基础数据平台为代表的统一金融大数据开放平台建设,实现大数据的深度应用。

2.形成数据治理机制,协力推动三方合作。大数据应用复杂度高,涉及制度、标准、技术、业务流程等多种要素。为更好利用数据价值,需要高层次规划协调及数据治理机制的配套跟进。在跨部门开展大数据应用时,应设立数据治理工作领导小组,构建多方合作基础。由金融监管部门制定数据治理制度、流程、标准,明确相关责任和义务;金融机构建立专门的大数据治理部门,协调部门间数据流动;行业协会充分发挥渠道优势,定期发布大数据治理报告,最终形成“监管部门引导、金融机构支撑、行业协会推动”的良好合作局面。

3.业务需求部门深度参与,数据、平台、应用同步建设。开展大数据应用,不仅需要科技部门推动,更需要业务部门深入参与。归根结底,大数据应用是为业务服务的,深刻理解业务应用场景才能更好的开展大数据应用。大数据应用中,数据是原料,平台载体,应用是场景的程序实现,只有三者同步建设,才能真正实现大数据应用。

4.借助内外部力量,提升大数据应用专业化水平。为扭转普遍存在的大数据人才短缺的局面,一方面应增强内部力量建设,做好相关培训,加强大数据人才培养,持续引进大数据人才;另一方面要积极寻求与外部成熟的大数据公司开展合作。金融机构具有数据和应用场景的优势,结合大数据公司的技术优势,将会促进大数据应用的快速落地,并产生巨大的市场价值。

5.大数据应用、系统数据整合、分布式架构、云计算转型融合推进。实现了数据整合、系统整合,才能为大数据的应用提供更好的数据基础。部署了分布式架构,才能满足了不断增长的计算、存储和网络带宽需求。而云计算则为大数据应用和分布式转型提供了更有弹性的计算、网络和存储环境。四者应同步规划,融合推进,不可偏废。

6.根据应用场景选择合适技术路线,稳步推进大数据应用建设。基于Hadoop的大数据平台和基于MPP的数据处理平台适应环境不同,没有哪种更优。在数据扩展需求不是特别大,需要的处理节点不多的场景,数据都是结构化的,可以考虑MPP,例如Greenplum/Gbase等。针对非结构化数据,或者数据量巨大,有需要扩展到成百上千个数据节点需求的,Hadoop是更好的选择。

7.做好大数据应用落地数据保护工作,防范失泄密公共安全事件发生。我国网络安全领域第一部基础性专门法律——《网络安全法》,对保护个人隐私和敏感信息作了重点规定,对大数据应用具有重要指导意义。针对金融行业实际情况,研究完善大数据存储、处理、共享、传输、基础平台安全等标准规范,能为各类金融大数据应用提供安全保障和应用依据。通过等级保护和关键信息基础设施保护专业力量,防范内外部风险。通过行业协会自律机制,防范道德风险。

声明:本文来自金融电子化,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。