近年来,随着信息化的持续推进以及工业互联网应用的逐步深入,工业企业的数据呈现爆发增长趋势,工业数据的分析挖掘在推动企业降本增效、提升竞争力等方面的作用也日益凸显。2018年末,中国信息通信研究院联合工业互联网产业联盟,针对我国工业企业数据管理现状开展了一轮调研。调研结果显示,工业企业的数据管理工作滞后于其他行业,数据基础还远远不能支撑智能化的需求,亟需“补课”。本文简述调研情况,对几个关键问题进行剖析,并提出后续思考。
一、工业企业数据基础仍然薄弱
数据管理的概念伴随着上世纪80年代数据库技术在各个行业的应用而诞生和发展,目标是为了更有效地对计算机系统中的数据进行存储和访问。数据管理在发展演进的过程中,形成了包括数据质量、数据安全、数据标准、数据互操作、数据共享与流通在内的多项核心管理职能,通过体系化的方式实现数据的可用、好用,从而更好地发挥数据的价值。2000年以来,银行、电信等信息化程度较高的行业,面临越来越庞大和复杂的数据资产,开始建设数据仓库,并逐渐建立起专业化的数据管理体系,较好地支撑了日益增长的经营分析与决策支撑需求。
工业领域信息化起步相对较晚,工业数据也更为复杂,涉及研发、生产、管理、运维、服务等多个环节,因而数据管理工作的推进也相对滞后。随着工业互联网发展的不断深化,在工业领域加强数据管理的重要性日益突出。与其他行业类似,工业数据管理工作的重点也是保障数据质量与安全、促进数据互操作,为工业智能提供高质量、高可靠的基础数据资源。
调查[1]显示,我国工业企业的数据资源存量普遍不大,66%的企业数据总量都在20TB以下,还不到一个省级电信运营商日增数据量的十分之一;管理手段比较落后,51%的企业仍在使用文档或更原始的方式进行数据的管理。数据孤岛情况普遍,企业对自身可用的数据资产缺乏全面了解。无论从管理手段上,还是技术手段上,都远远不能支撑工业互联网发展应用后数据管理的风险和复杂度。
二、工业企业数据管理落地实施滞后
企业对于数据的重视和理解程度是其开展数据管理工作的前提。随着工业企业信息化的普及以及工业互联网的快速发展,工业企业对于数据管理重要性的认识正逐步提高,但实际落地情况却令人担忧。调查显示,98.6%的企业觉得数据管理工作值得投入,其中77%的企业坚信数据管理很重要,并认为数据管理是一个长期的过程且会为企业带来价值。然而,仅32.4%的企业开展了数据管理相关工作,接近半数的企业尚未规划专门的人力投入。
相比之下,金融领域已经充分认识到数据管理工作的重要性并已经形成了企业和行业层面的工作机制。早在2011年,原银监会就印发了《银行监管统计数据质量管理良好标准(试行)》,从组织机构及人员,制度建设,系统保障和数据标准,数据质量的监控、检查与评价,数据的报送、应用和存储等5个方面对银行业的数据进行监管。2018年5月原银监会又印发了《银行业金融机构数据治理指引》,要求银行业金融机构应当将数据治理纳入公司治理范畴,建立自上而下、协调一致的数据治理体系。目前大部分国有银行和股份制银行都已经建立了专门的数据管理部门,数据管理已经成为信息化的常规性基础性工作。
三、工业数据集中化引入新的安全风险
随着传感器的大量使用,以及云计算、大数据等新兴技术带来的数据汇集,工业数据和应用呈现快速增长趋势,企业数据的存储和管理面临着新的挑战。工业企业在选择本地化部署工业互联网平台或是云服务商进行数据和业务的托管时,首要考虑的因素是成本和安全。据2018年的统计数据显示,减少基础设施投资和满足资源快速扩展需求是企业选择公有云的重要原因,但最大顾虑仍是公有云的安全性[2];超过50%的企业会出于安全性和可控性选择私有云[3]。工业企业对于安全性尤其重视,特别是在看待数据上云问题时,仍保持谨慎的态度。
顺应数据融合互联的趋势,以传统物理隔离、封闭数据的方式保障安全已经不再适合新时期下的数据环境。然而,数据向平台集中的发展趋势会形成新的潜在安全风险。2018年7月,包括通用汽车、菲亚特、克莱斯勒、福特等100多家制造企业的敏感文件就因其合作供应商存储服务器的漏洞而面临泄露风险[4]。云服务安全事故频发,且行业尚未形成完善的数据资产定价和赔偿机制,更导致了工业企业对数据上云心存芥蒂。
四、工业数据流通需求旺盛但阻力很大
工业互联网的价值体现在数据跨领域跨行业的共享。随着数据应用需求和大数据技术的发展,工业企业对于数据合作的需求大量增加。调查显示,超过半数的企业表示需要使用外部数据或对外提供数据。数据流通需求的增长会带来很多问题和挑战,比如数据质量、数据定价和数据流通合规性等。实地走访中,大量企业表示由于没有明确的法律法规保障以及成熟的技术解决方案支撑,对于企业间数据合作存有很大的顾虑。国内外对于数据流通的研究已有一段时间的积累。德国从2014年开始进行工业数据空间的研究,随后组建了国际数据空间(IDS, International Data Spaces)协会,目前已有近百家企业和组织加入。其核心理念是企业在保有数据主权的同时进行数据的共享交换。国内银行业的数据流通由政府层面推动,其中最典型的应用是征信服务,早在2006年央行就成立了征信中心,全面收集企业和个人的信息。在互联网金融发展起来之后,2018年,也是在央行的指导下成立了市场化的征信机构——百行征信。
但国内整体上工业数据流通体系仍然不完善,虽有多家活跃于市场的数据交易中心,但数据流通的合法合规性仍未得到应有的重视,现行法律对于数据流通的很多问题都没有明确,许多工作仍以行业自律的模式开展。工业企业数据流通需求与日俱增,规范数据的共享和开放刻不容缓。
五、后续发展思考
当前,我国工业企业的数据管理工作从整体来看还处于起步阶段。一些大型企业可能由于数据增长或业务需求已经有一些数据管理的经验积累,但大部分企业仍在摸索之中。为此,企业还需要加强数据意识,加快推进和落实数据管理工作。
工业企业一是需要提升数据管理意识,积极跟进业务需求,以需求带动数据管理体系建设。二是要开展新技术引入,合理衡量技术使用风险和成本,有效推进数据管理工作。三是要在强化安全意识的同时积极应对风险,实施数据分级分类防护,建立数据保障体系。四是要直面数据流通的需求,加强数据主权意识,对企业自身的数据资产负责。同时,政府和行业层面也需要积极发挥引导作用,指导相关标准制定,建立完善工业数据的监管体系,支持行业自律机制的发展,为企业的数据应用和企业间的数据合作提供可靠保障。
[1]后续文中未特别标注的调查数据,均来源于《2018工业企业数据资产管理现状调查报告》。
[2]数据来源:中国信息通信研究院《中国公有云发展调查报告(2018)》 [3]数据来源:中国信息通信研究院《中国私有云发展调查报告(2018)》 [4]https://www.nytimes.com/2018/07/20/business/suppliers-data-leak-automakers.htm
作者简介
王妙琼,中国信息通信研究院云计算与大数据研究所大数据与区块链部工程师。从事大数据基础平台架构、行业大数据应用等研究,牵头流计算、时序数据库等多项行业标准的制定,参与《工业大数据技术架构白皮书》《工业企业数据资产管理现状调查报告》等研究报告的编写。
联系方式:wangmiaoqiong@caict.ac.cn
魏凯,中国信息通信研究院云计算与大数据研究所副所长,高级工程师。国际电信联盟标准化部门(ITU-T)分布式账本焦点组(FG DLT)副主席,中国通信标准化协会互联网与应用技术工作委员会大数据与区块链工作组组长(CCSA TC1 WG6)。主要研究方向为云计算、大数据、区块链相关技术、标准和政策,参与《促进大数据发展行动纲要》、“十三五”规划等文件的研究起草。
联系方式:weikai@caict.ac.cn
声明:本文来自中国信息通信研究院CAICT,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。