本文作者为自然资源部测绘发展研究中心周夏。文章于2023年获得中心“学习贯彻党的二十大精神”主题征文优秀论文二等奖。
进入数字时代,“数据”快速融入生产、分配、流通、消费和社会服务管理等各个环节,深刻改变着生产方式、生活方式和社会治理方式。“数据”成为数字经济发展的核心生产要素,是国家重要资产和基础战略资源。但数据不直接等同于数据要素,数据需要转化成为数据要素并进行市场化流通交易,那么数据分类分级是必要前提和首要工作,可以说数据分类分级既是数据资产管理的手段,也是数据安全治理的方法,是确定数据保护和利用之间平衡点的重要依据。
地理信息数据作为重要的生产要素和战略性数据资源,支撑治国理政,赋能各行各业,服务千家万户,在推动高质量发展中具有基础性先行性的重要地位和作用。因此,推进地理数据分类分级路径探究,统筹发展与安全,将非涉密数据作为数据资产、生产要素管理起来的同时,清晰划出“数据安全岛”,采取相应控制措施保障数据依法有序自由流动,可以不断增强测绘地理信息数据获取和服务支撑能力,更好推动地理信息数据资源向数据资产转变,助力数字经济发展。
一、数据分类分级的相关实践与路径分析
1、国外数据分类分级相关实践
上世纪数据分类分级的相关概念虽未明确,但相关政策就广泛存在。早期,分类分级对象为政务信息,主要与国防军事有关,出现“绝密”“机密”等分类分级术语。后来延伸至信息安全管理领域,分类分级对象拓展至企业/组织数据和个人数据,适用范围由政府部门拓展至企业/组织[1]。
随着数字经济的迅猛发展,全球各国都意识到数据安全治理的重要性,纷纷开展数据分类分级实践。目前,国外法律法规中直接对数据分类分级保护制度的表述较少,但在一系列法规政策文件中均体现了数据分类分级的思想。在立法层面取得基本共识的分类标准是将数据分为个人数据和非个人数据。例如,欧盟通过《通用数据保护条例》保护个人数据的同时,还制定了《非个人数据在欧盟境内自由流动框架条例》。印度2021年《数据保护法(草案)》同时规制个人数据和非个人数据,并将个人数据分为一般、敏感两类。此外,针对具体行业领域,各国提出不同分类标准,美国国防部及相关军工机构根据《国际军火交易条例》、医疗部门根据《健康保险携带和责任法》、金融服务部门根据《格雷姆里奇-比利雷法》对其领域内的个人隐私信息、科学技术数据、涉密敏感数据制定了细致的分类清单[2]。
对数据分类分级的具体要求主要出现于各类信息安全标准中。早在2013年,国际化标准组织出台的ISO27001:2013信息安全管理标准,指出信息分类的目标是确保信息按照其对组织的重要程度受到适当的保护,明确了信息分类的要求,规范了应参考的控制目标和控制措施。2010年美国总统奥巴马签署了《受控非密信息(CUI)》,将CUI信息划分为若干类别、子类别,虽然没有实质上对信息进行级别划分,但对于数据的传播范围进行了分类。近10年来,美国CUI制度主要通过标准指南、部门规定的方式步落地完善。
2、国内数据分类分级相关实践
我国对于数据分类分级的关注早有迹可循。事实上,将国家秘密划分为绝密、机密、秘密,以及将政府信息划分为主动公开、依申请公开和不公开三类就是一种朴素的数据分级方法。自上世纪90年代起,数据分类分级相关学术研究兴起,研究重点从地图要素到以数据挖掘为目的的数据分类分级再到以数据安全为目的开展研究[3]。
数据分类分级作为一项管理制度被提出主要集中于近5年。国家层面,在2016年国办印发《国家信息发展战略纲要》中明确提出“探索建立信息资产权益保护制度,实施分级分类管理”。同年,国务院印发的《“十三五”国家信息化规划》中提出“推动数据资源分类分级管理”。2018年,国办发布《科学数据管理办法》要求“法人单位要对科学数据进行分级分类”。2019年中共中央国务院《关于构建更加完善的要素市场化配置体制机制的意见》指出“推动完善适用于大数据环境下的数据分类分级安全保护制度”。2021年3月,《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》特别指出要“营造开放、健康、安全的数字生态,完善适用于大数据环境下的数据分类分级保护制度”。2021年9月《数据安全法》颁布实施,标志着数据分类分级保护制度作为国家数据安全的基本制度确立下来。同年11月,《个人信息保护法》颁布实施,明确了“对个人信息实行分类管理”。部门/行业层面,网信办、质检总局、工信部相继开展了跨行业数据分类分级标准制定,工业、通信、金融等行业也开展了行业数据分类分级探索。除2020年2月工信部印发的《工业数据分类分级指南》外,其余均以国家标准、行业标准的方式发布。地方层面,贵州、上海、福建、浙江、重庆、北京等地相继发布政府数据分类分级指南。例如,早在2016年贵州就发布了全国首个地方政府数据分类分级指南(现已废止,启用了新标准)。
3.当前我国数据分类分级的保护路径分析与评价
当前数据分类采取的路径主要是一种所谓的“实然”路径,即不改变实际组织生产的方式和流程,且客观描述在这个方式和流程中所收集、产生出的数据类型。基本是从业务条线出发,首先对业务细分,其次对数据细分,在完成数据分类的前提下,根据“后果”路径,来对数据进行分级。此种路径的基本思路是根据某类数据的安全属性(完整性、保密性、可用性)遭到破坏后的影响对象、影响范围、影响程度,对数据进行定级。但是对象、范围、程度标识不太相同。影响对象有的是“国家安全、公共利益、个人合法权益、组织合法权益”,有的是“国家安全、经济运行、社会稳定、公共利益、组织权益与个人权益”,如果是行业或政务层面,还会是“工业生产、经济效益”“行业、机构、客户”“党政机关、公共服务机构、其他机构及自然人”等。影响程度也是“轻微危害、一般危害、严重危害”“特别严重危害、严重危害、一般危害”“非常严重、严重、中等、轻微”等,相应地定级分为3至5级都有。
在《数据安全法》颁布前后,地方层面主要是对政务数据和公共数据分类分级,虽然都有根据数据遭篡改、破坏、泄露或非法利用后对国家安全、社会秩序、公共利益以及对公民、法人和其他组织的合法权益(受侵害客体)的危害程度(范围和程度来衡量)去划分数据,但有的实际定级倾向于确定数据敏感级别,如浙江省《数字化改革公共数据分类分级指南》确定数据的安全级别,以不敏感、低敏感、较敏感、敏感为标识分为L1-L4级,并非分为核心、重要、一般数据。有的是不再涉及分级,而是在分类维度中设置安全保护或管理维度,在此层面,根据政务或公共数据在经济社会发展中的重要程度划分为核心数据、重要数据、一般数据3个分类类别,并按线分类法划分对应的安全保护数据再下一级分类类别,如浙江省《数字化改革公共数据分类分级指南》和《贵州省政务数据 数据分类》。而《北京政务数据分级与安全保护规范(DB11T 1918-2021)》倾向于数据定级,虽然也基于数据发生泄露、篡改、丢失或滥用后对影响对象、造成影响程度和影响范围来进行影响分析,但影响对象明显缩小更具体,为党政机关、公共服务机构、其他机构及自然人。
总体而言,我国法律法规层面仅仅止步于提出数据分类分级的要求,并没有对如何分类分级提出进一步的方案。国家、地方以及行业标准或者国家部委发布的指引性文件,会给出一些尝试或方案。所提出的数据分类分级路径基本上是先分类,以数据分类为基础后分级,最后实施分级保护。同时,目前依据部委指导性文件和标准所提出的数据分类分级路径,实际上是采取“自下而上”的数据分类分级,本质上是站在组织的内部视角来看数据分类分级,保障本组织的资产、权益及安全,各个行业、部门间分类分级对象、范围、程度标识以及最后定级并不相同,跨行业、跨部门间不具备互操作性,但数据本身是具有可共享性、衍生性、多归属性、动态性等,导致实际工作中无法开展统一的数据监管工作,不利于数据的高效流通利用和有效保护。
二、数据分类分级存在的问题和挑战
1.标准衔接困难
《数据安全法》要求“国家建立数据分类分级保护制度”,意味着数据分类分级工作自上而下开展,各地区、各部门根据国家法律法规和标准规范制定本领域、本行业数据分类分级标准规范。目前,各行业、各地方纷纷开展了数据分类分级标准制定工作。经调研,各部门、各地方对于数据分类分级的理解存在差异,主要体现在分类方法上,尤其是部分标准出台于《数据安全法》颁布前,数据分类分级思想还未统一。
由于数据存在流通性和融合性,尤其是测绘地理信息数据服务于经济社会发展的各个领域,例如基础地理信息数据既可以作为国土空间规划基础数据,也可以作为生态环境保护、农业农村发展的基础数据。如果数据仅在一个部门内部静态管理,尚且不会出现问题。但数据一旦流动起来,由于缺乏对数据分类分级的共同理解,分类分级方式和数据目录存在较大差异,将会造成部门间、部门与地方的共享数据时接收和创建数据时易出错或阻碍共享。此外,由于各部门存在数量繁多的数据分类分级标准,如果标准未能有效衔接甚至冲突,那么行业单位将难以执行数据分类分级和保护相关业务。如何解决衔接问题是目前数据分类分级工作的重大挑战之一。
2.数据分类维度复杂
数据分类可以有很多维度,包括基于数据形式和数据内容等。基于数据形式可以按照数据的存储方式、数据产生频率、产生方式、数据所处地理位置、数据规模数量、共享或交换方式等进行分类;数据内容可以根据数据所涉及的主体(国家、行业、组织)、业务维度(包括数据来源、业务领域、责任部门、描述对象、上下游环节、数据主题、数据用途、数据处理)等多个维度进行分类。不同维度各有价值,如何选择维度需要考虑数据分类的目的。同时单一分类维度下的类别划分有可能存在问题,例如,基于内容进行分类的维度,由于大范围内的内容分类是一个很复杂的问题,甚至可能涉及知识分类,会导致数据可能分类不全、类别不清晰的问题。
3.数据分级科学性有待提高
目前,所有标准指南中,数据分级基本依据重要程度和损害影响程度来综合定级,部分强调了定量和定性相结合,但在标准中并未提及具体定量指标,事实上仍属于定性。由此引发的问题,不同数据处理者在根据标准规范进行数据分级和重要数据识别过程中,对于重要程度和损害影响程度的认识不同,容易造成不该是重要数据的划为了重要数据,不该是一般数据的划为一般数据。另外,目前尚无科学的方法和范式支撑构建信息内容的数学模型,因此很难准确定量地对重要程度和损害影响程度进行数据内容描述。
4.数据分类分级和数据处理需求在数据生命周期中发生变化带来的挑战
由于数据在其生命周期内不断变化,例如地理信息数据融合了新要素衍生产生新的数据,地理信息数据集与农业数据集相融合,地理信息数据中某个要素被删除销毁,又或者重要数据降密为一般数据等等,此类变化将使得建立和维护数据目录的过程变得异常复杂。
三、地理信息分类分级发展策略
1.从统筹发展和安全高度明晰数据分类分级原则,加强我国地理信息数据分类分级的顶层设计
当前,数据分类分级原则在法治体系中的定位模糊与实施规则不清已成为阻碍数据要素市场化配置流通的现实制度难题。因此亟须明晰数据分类分级原则的法治定位,在此基础上完善数据要素市场化的法治体系。基于地理信息事关国家安全、处于动态变化及可能包含不同等级的要素的特性,从统筹安全和发展的角度来看,要坚持合法合规、就高从严、动态调整、点面结合、统一维度原则,开展地理信息数据分类分级工作。
同时,目前各部委、各地方在“自下而上”开展基于地方事务或者部门管理工作分类分级路径,虽然有助于自身平台数据资源利用和安全管理,但是不足以支撑国家安全观视阈下的数据安全管理。地理信息数据开放分类分级管理应坚持“自上而下”,探索当前加快建设全国统一大市场背景下地理信息数据要素市场的培育与完善,为地理信息数据产权界分、流通利用、安全保护等做好顶层设计。要立足全局视角、国家层面,围绕服务数字经济,在保障数据安全的前提下,充分发挥数据生产要素价值的核心目标,对地理信息数据分类分级框架进行统筹规划,确定各组成部分和各要素,涵盖分类分级标准指南的确立、实施管理、自上而下地解决数据分类分级的各种问题,进而形成一个完整、科学的分类分级体系。
2.探索数据分类分级管理思路,研究建立科学、合理的分类分级评价指标体系
由于地理信息数据的高度复杂性,不同视角、不同管理主体、不同管理目的均会产生的各式各样的分类方式,不存在唯一的分类分级方式。地理信息数据分类分级的目的在于划出数据的等级,只有在满足多数应用场景下,能够清晰划分数据等级以及识别重要(核心)数据,尽可能“穷尽”覆盖所有地理信息数据的分类分级方式才是最符合地理信息数据分类分级工作实际的。现有地理信息数据管理未具体体现数据分类的逻辑层次,既不属于树结构的线分类,也不属于从地理信息数据的若干个维度出发的面分类方式,难以实现对于数据的全量分类,同时也容易出现同一数据的多次重复分类。且多数从数据本身属性出发,对于业务管理需求的维度考虑较少,不能清晰地理顺体现业务管理上的数据。
地理信息数据分类应按照先业务属性分类再数据属性分类的思路,主管(监管)部门结合自身数据管理和应用需要对数据进行分类,根据本行业本领域业务属性,对行业领域数据进行细化分类。研究建立科学、合理的评价指标体系,根据地理要素对于国家安全的重要尺度,结合空间尺度、几何特征、属性、时间、范围等因素综合划分类型,制定地理信息分类指南。地理信息数据作为基础性和战略性资源,既要考虑单项数据分级,也要充分考虑多个领域、群体或区域的数据汇聚融合叠加衍生后对数据重要性、安全风险等的影响,通过定量与定性相结合的方式综合确定数据级别。
3.加快重要数据、核心数据管理工作,以负面清单制度推进数据分类分级体系实施
数据的价值在于流通交易,应加快推进制定重要数据目录,避免将过多的数据纳入重要数据的保护范围之中,确保地理信息数据要素市场生产流通的安全和秩序。推进地理信息重要数据、核心数据的识别工作,进一步明晰重要数据、核心数据认定标准,尤其是定量标准,完善重要数据、核心数据存储管理,配套建立重要数据、核心数据更新维护、动态调整管理机制。
基于地理信息数据的可共享性、复用性、跨地域性、动态性、使用加权等特征,必须清醒认识到数据多元主体间多元利益并存的现实问题,坚持让市场对资源配置起决定性作用,厘清政府与市场的边界,以负面清单制度推进数据分类分级体系实施,以此培育数据要素市场良好环境,激发数据要素市场主体活力。探索地理信息数据动态负面清单制度,结合地理信息数据分类分级体系,将各类型数据中应属于核心数据与重要数据范围内的数据纳入负面清单进行管理,根据国内外数据发展态势,适时调整核心数据、重要数据目录,动态优化数据要素负面清单制度。在负面清单模式下,明确政府管制的范围和具体事项,清单之外的数据要素则允许市场自由流通,推动有效市场和有为政府更好结合。同时数据作为全球经济竞争新赛道,为更好地参与到数据资源的国际竞争之中,重要数据目录和负面清单制度等政策工具的灵活使用,实施因地制宜的数据流通交易策略,可以保障我国的主权、安全和发展利益最大化。
声明:本文来自自然资源部测绘发展研究中心,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。