作者:建信金科北京事业群 姜兆龙 李冬晓
人工智能历程
人工智能概念于1956年8月的达特茅斯会议首次被提出,其后历经三起两落。直到2006年,Geoff Hinton等人提出深度学习方法,基于该方法构建的Alex Net在2012年图片分类的竞赛Image Net大放异彩,Top-5错误率比前一年的冠军下降了十个百分点,远超当年的第二名。自此,深度学习开始席卷整个计算机视觉领域,并逐步向其他领域扩展,人工智能的理论研究又迎来新一轮高潮。2016年人机围棋大战中,阿尔法狗4:1战胜李世石,社会大众对人工智能的关注热度再次被点燃。普华永道研究预测,到2030年人工智能将为全球GDP带来14%的增长,相当于15.7万亿美元的市场规模。
制度建设
人工智能在商业银行的风险计量、客户关系维护、交易反欺诈、运营配送等前中后台业务领域都有广阔的应用。在风险计量方面,人工智能可以自动验证和分析银行头寸,一些银行已将该流程所需资源减少了95%,所需时间从10天缩减到20分钟。巴克莱银行在财务部门使用机器人,实现坏账准备金流程自动化,每年节省将近1亿美元。麦肯锡全球研究院的研究估算,严格来说,60%的职业中至少有30%的工作是能够实现自动化的。
虽然人工智能有广阔的应用前景,但商业银行若想真正发挥其提高效率、降低运营成本的优势,必须从人才储备、文化建设、部门协作等制度建设到外部数据引起、敏捷构建等技术建设全方位布局谋篇,主要体现在以下方面。
1.重视人才储备。根据腾迅研究院发布的《2017年全球人工智能与人才白皮书》统计,中国对人工智能的人才需求已破百万,但人才供应严重短缺,截止到2017年10月人工智能人才的需求量已经是2016全年的两倍,人才平均月薪2.58万,具有五年以上人工智能相关工作经验的人才平均月薪4万元,并普遍带有股权激励措施。在我国,商业银行普遍受制于体质机制限制,难以批量进行人才引进,拔尖人才的少量引进与内部人才的培养相结合是比较切实的战略。
人工智能在数学理论上主要涉及线性代数、概率论、数值计算理论。其中线性代数主要用来描述对象及对象间的关系;概率论是机器学习的“建模语言”,可以基于频率或贝叶斯概率对研究对象的分布进行建模,再利用最大似然估计或最大后验估计进行参数估算;数值计算理论中的梯度、凸优化等理论可以用来解决无限制和有限制条件下最优解,均方误差可以衡量估计量与被估计量之间差异程度。人工智能的编程框架主要有Caffe、Tensorflow、Sklearn等;模型上主要有回归、聚类、支持向量机、卷积及循环神经网络等;编程语言主要涉及Python、Spark、C++等。商业银行需要梳理知识图谱,引入外部培训、鼓励员工自主学习和参加行业交流,为人才培养储备、技术选型和战略落地提供支撑。
2.构建允许试错的企业文化。人工智能的应用开发是一种探索性、持续改进的过程,受技术路线、数据规模及质量、框架及模型选取、评价体系、部门协作水平、监管要求等多重因素的共同作用,易出现模型构建时间过长、实际应用效果不显著等问题。人工智能的构建很难一蹴而就,开发人员通常要在生产系统上不断地进行调整。商业银行要构建允许试错的企业文化,采取区别于传统的业绩考核机制,支持探索创新。
3.高层推动的部门协作。算法和模型如何嵌入到业务中是人工智能发挥高效能、降低运营成本的关键,其成功运用通常需要跨业务部门的通力协作。高管推动是保证成功的重要前提条件。商业银行需改变过去从机构自身和内部管理出发来决定如何服务客户,打破部门银行的观念,树立以客户为中心的理念,从客户视角实现流程再造,构建企业级视角的人工智能,从而提升客户体验、提高业务办理效率、提升竞争力。
4.明确的商业目标。人工智能的发展方兴未艾,但是尚未出现一统江湖的“终极算法”。商业银行在对人工智能的利用上应有一个个明确的“小目标”,切忌求全求大。明确的商业目标决定解决问题应采用的框架(有监督学习或是无监督学习、采用分类或是回归方法、是批处理学习或是联机学习)、效果评价体系(采用均方误差评价、混淆矩阵评价等)及后续投入产出比。开发人员需与业务人员沟通待解决的问题,以往有无人工的解决方法,解决的过程及表现情况。
技术建设
1.构建异构的生产环境。人工智能尤其深度学习在模型训练时采用的是反向传播算法,涉及海量的矩阵运算,传统生产部署架构无法满足爆发的计算能力需求。业界通常采用异构计算架构(CPU+GPU模式),CPU更多用于控制和参数同步,GPU用于计算,两者相互配合,达到人工智能计算最优的效果。但GPU的功耗较高,在大规模模型训练时尤甚,商业银行在部署人工智能生产环境时需提前做好能耗规划工作(见图1)。
图1 商业银行人工智能技术构建流程
2.多样化数据来源。大数据是人工智能的基石,卓越的人工智能离不开强大的数据支撑。随着服务线上化、交易电子化不断推进,商业银行不可能仅依靠自有数据构建人工智能。比如股权质押、信用证、票据担保、金融衍生品等中间业务的大力发展,商业银行的风险敞口计量就需要引入第三方数据乃至互联网数据,基于自身数据与外部数据综合集成,构建准确、客观的人工智能应用,科学评估风险敞口。
3.敏捷的构建理念。商业银行需树立“人工智能即服务”的理念,人工智能不仅对内可提升效率降低成本,还可对外赋能为客户提供智能投顾等服务,敏捷的响应是提升用户体验提高企业竞争力的关键因素。
人工智能的敏捷响应依赖于数据处理框架和软件开发模式共同作用。商业银行传统的数据处理框架是一种离线式的模式,不能支撑实时人工智能。随着流式数据处理框架在互联网界的兴起,实时人工智能成为可能,为平衡过往商业银行在离线式数据处理框架上的巨额投资、离线模式自身优势与敏捷响应需求之间的矛盾,商业银行需要进行数据架构革新,引入Lambda等融合式架构,其本身整合离线计算和实时计算,融合不可变性,读写分离和复杂性隔离等一系列架构原则。在开发模式上,商业银行可引入敏捷开发模式,其本身是一种以人为核心、迭代、循序渐进的开发方法,持续交付有价值的产品,快速响应客户不断变化的需求。
4.高质量的标注集。数据标注是对未处理的初级数据,包括语音、图片、文本、视频等进行加工处理,转换为机器可识别信息的过程。现今人工智能大多数均为有监督学习,而数据标注是有监督学习的前提条件。
标注集的质量和规模是人工智能的智能程度的决定性因素。微软研究院在2001年发布的著名论文《The Unreason-able Effectiveness of Data》研究表明,一旦数据集规模足够,各类自然语言去歧义的算法表现不分伯仲。在过去短短七年,ImageNet比赛冠军的识别正确率从71.8%提升到97.3%,超过了人类,证明了更庞大的数据可以带来更精确的结果。可以说,标注集的规模和质量是各家人工智能企业的核心竞争力。金融企业若要在人工智能领域掌握核心科技,必须将标注集建设作为最基础、最重要的工作。
5.框架及模型的选取。在人工智能领域,目前有Caffe、Tensorflow、Keras等数目众多的开源框架,各有优势。在框架选取上,商业银行可以从其支持的开发语言、成熟度、执行速度、GitHub活跃度等多方面综合考量(见表1)。
表1 各框架在GitHub活跃度
对网络模型的选取上,以图像分类为例,目前有Alex-Net、BN-AlexNet、BN-NIN、GoogLeNet等神经网络。各模型在识别准确度、训练及推理时间、内存及计算资源消耗上不尽相同,开发人员需要综合考量。
6.数据集的构建。目前将数据集拆分为互不交叉的训练集与测试集,是人工智能建设通用的做法。在此,项目组人员需要关注过拟合和欠拟合两类问题。对于没有很好捕捉数据特性的欠拟合问题,测试人员可以建议开发人员选取更强大的模型,在学习算法中加入更多的特性,降低对模型的限制等措施;对于模型泛化能力差的过拟合问题,开发人员可以通过简化模型等正则化操作,提高模型的泛化能力。
在模型验证阶段测试人员需注意的是切不可基于同一数据集反复验证,如此操作一定会引起过拟合的问题。避免该问题可以采取将数据集进一步分为训练集、验证集和测试集的方案,利用验证训练集训练出来的算法模型。
7.评价体系的更新。功能测试就是根据功能测试用例,逐项检查产品是否达到用户要求的功能。非功能性需求是指依一些条件判断系统运作情形或其特性,而不是针对系统特定行为的需求。可以说,功能测试就是验证某个功能点是否满足设计,通过标准是正、反案例全部通过的“与”操作。非功能测试的核心关注点就是组件或系统的单位时间内的吞吐率及响应时间是否满足设计指标,是在资源约束的条件下对系统最佳表现的度量。商业银行测试评价体系中,两者泾渭分明。
人工智能产品评价体系的建设目前是学术界研究的前沿领域,虽然各类识别大赛最关注的是模型精准度,但在生产实际中,商业银行需要从模型精准度、内存占用、网络参数、计算开销、推理时间、能耗等建立全方位评价体系。理想的人工智能系统是在一定的资源限制条件下,用更短的推理时间实现更高的模型准确度。但是据《AN ANALYSIS OF DEEP NEURAL NETWORK MODELS FOR PRACTICAL APPLI-CATIONS》一文对历年ImageNet图像分类竞赛历届冠军的分析发现,理想系统目前并不存在。更高的模型准确度,意味着更多的神经网络层级,更多的内存及计算资源消耗、更长的推理时间,可以说功能和非功能特性彼此紧密联系,并呈现反向关系的特征。为此,商业银行需要更新现有的评价体系,基于现有资源约束,根据业务部门对时效性、准确率的要求做出综合评价。
建行人工智能开展情况
建设银行人工智能布局较早,并一直稳步推进。早在2013年,建设银行就通过官方微信公众号推出金融小管家-“小微”服务,利用人工智能技术为客户解答咨询并办理业务。2016年,“刷脸认证”功能在手机银行中进行了全面推广,提升了用户体验。在同年推出创新个人融资模式的网上自助贷款产品“快贷”,客户可全流程自助办理自动审批。2017年部署了新型反欺诈系统,实现异常交易实时侦测和阻断,保障了客户资金安全。2018年部署了智能投顾功能,实现了人工智能的赋能。
现阶段人工智能仍以解决简单重复劳动的弱人工智能为主,未来随着神经网络层级的不断加深,强人工智能时代一定会到来。商业银行需要结合自身业务特点,不断紧跟技术发展趋势,在金融科技浪潮中迎头赶上,实现跨越式发展。
本文节选自《金融电子化》2019年04月刊
声明:本文来自金融电子化,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。