2024年3月24日,美陆军正式签署并发布了《统一数据参考架构》(UDRA)1.0版。该架构是陆军首席信息官与工业界合作的成果,由负责数据、工程和软件的陆军副部长提出,并由负责采办、后勤和技术的副部长以及首席信息官共同签署。该架构是美国陆军推动的一项重要举措,旨在增强数据治理和系统之间的互操作性,解决了不同系统和项目之间数据管理的挑战。本文对文件主要内容进行编译。
美陆军正式签署《统一数据参考架构》
背景
美国陆军当前的数据架构极为复杂,涉及网络、系统以及用于移动和共享数据的消息协议。这种架构导致了数据的过度复制和存储,降低了数据共享效率,并妨碍了数据驱动决策的主导地位。陆军必须从目前的网络/系统中心化转向以数据为中心的架构,以便更快地向决策者提供所需数据,这将有助于加速作战任务的执行并取得成功。
为了解决这些问题,需要简化陆军的数据架构,并优化与跨部门或跨任务领域的合作伙伴共享的数据产品。陆军应该通过完善反馈机制,提升数据产品的品质,从而更好地满足作战人员对数据的需求。
主要内容
(一)基本架构
《统一数据参考架构》采用数据网格(Data Mesh)的架构,强调简单和分布式数据管理,使分散在不同地理空间的平台和用户以分散和灵活的方式处理和共享信息,实现在数据生态系统中生产、应用、编排和可互操作的共享。下图展示了基于数据网格的基本架构和流程:
基于数据网格的基本架构和流程
定义数据管理策略,这些策略以机器可读的格式编码,以便网络内的多个平台能够自动执行这些策略。这些策略不仅支持数据产品的生成、使用和编排,还促进了数据产品间的共享。同时,系统会存储所有的数据治理策略,并在需要时利用它们进行发现和检索。数据源和数据产品可以被用来合成新的数据产品,这些新合成的数据产品可以随时被访问和使用。
一个数据产品的视图包括需求元数据、描述字段和有效负载三部分组成。需求元数据包括授权参考、创建日期、描述、披露和可发布性、格式、处理限制、标识符、名称、输出端口、分类、版本、创建者和组织机构等信息;描述字段包括数据访问协议、校验信息、标准符合性、数据质量、参考文档、域描述要素、有效时间、反馈、文件大小、哈希校验、输入端口、位置标签、逻辑数据模型、成熟度、物理数据架构、接触点、源信息、搜索关键字标签、相关指标和目标、使用协议、使用方法等信息。数据产品的特征包括:由一个或多个数据源或数据产品的生产者拥有和生产;直接与用户共享;遵循一套可用性特征;独立于其他数据产品进行管理。数据产品的视图如下所示:
数据产品视图
在执行陆军的关键任务时,关键角色为决策者或指挥官,通过其合理的战术决策需求,作为数据产品需求信号的输入。决策者或指挥官通过不断获取和利用数据产品,支持其战术决策。
(二)指导原则
信息和数据需满足VAULTIS(即可获取、可访问、可理解、关联性、可信赖性、互操作性及安全性)要求,并以可见的数据产品的形式在整个陆军中产生、交互和使用;
信息和数据应允许用户自主使用;
数据产品的产生和托管应是分散而非集中的;
数据产品设计和架构应由生成数据产品的数据域拥有和控制;
元数据应与数据产品紧密耦合,包括发现、选择、检索以及有效使用所需的信息;
应根据用户需求和反馈设计和优化数据产品;
数据域可以创建源数据和上游数据产品派生的聚合数据产品,用户不应保存、复制或共享收到的数据产品;
计算治理将确保数据治理策略的自动实施。
(三)执行步骤
1、确定数据产品需求
基于决策驱动数据概念,决策者提供需求,用户搜索当前数据产品,满足当前军种决策过程,并与现行理论保持一致。
2、生产数据产品
使用传感器馈送、存储的数据集、信息流以及内外部数据域生成的现有数据产品,通过收集、整理、转换并打包成数据产品。
3、注册数据产品
生产者为该数据产品注册发现服务,加入标识性和描述性元数据,并完成编目支持用户查看。
4、发现数据产品
采用人工智能、机器学习或手动进行发现,用户收到可供选择的数据产品元数据,随后通过审查选择并检索需求数据产品进行使用。
5、检索数据产品
基于生产的数据产品的元数据检索相关信息。
6、合成用户数据产品
基于当前的数据、接受的数据产品合成新的用户数据产品,由终端用户使用以进行分析、可视化和决策支持。同时该用户产品可被注册和共享。
7、提供反馈
当数据产品质量不符合要求或需要改进时,用户向生产者提供反馈。在定义数据产品一致性、验证和/或确认政策的基础上,反馈机制可通过计算治理实现最大程度的自动化。
8、响应反馈
生产者确定并采取适当措施,包括质量、及时性或其他优化措施,改进和更新数据产品的军种级目标,增强基于数据产品的响应。
(四)计算治理
基于美国《国防部数据战略》和《陆军首席信息官的数据治理角色和职责》定义的数据管理的角色和职责,陆军首席数据和人工智能官和数据委员会提供了必要的支持,用于实施联合数据网格治理模型,这是优化算法在数字信息系统中应用的关键,并且支持策略执行、验证和确认的自动化流程。数据治理主要包括以下两个方面:
1、基于策略一致性的计算治理
采取如下措施保障计算治理的各项规定付诸实施:
采用陆军首席数据和人工智能官制定的全球控制措施、标准和政策,完成措施的计算和执行;
基于保障网络的一致性、互操作性和质量,采用“标准即代码”、“作为代码策略”、“(环境、条件)应激即代码”、“自动化脚本和测试”等作为实施原则;
通过自动化监控在数据生命周期的早期和整个过程中管理风险;
按需启动自动告警和通知机制;
基于数据使用情况评估网络效果。
2、自动化策略实施
计算治理服务提供自动化的策略执行。结合数据产品元数据和描述字段中列举的数据产品特征,计算治理可确保符合国防部数据战略中的七大目标,并基于数据网格联合治理和执行的策略使用计算治理服务来实施。
下图展示了计算治理的实施过程:
计算治理实施过程
应用示例
美陆军是围绕作战职能进行组织的,基于任务式指挥,通过作战人员接受训练,执行与收集数据和信息以及合成产品相关的特定任务,具体包火力、情报、移动和机动、保护和保障等五大职能。下图表示了美陆军执行任务式指挥控制的概念数据域:
美陆军任务式指挥用例的数据域组成和逻辑关系
其中职能的具体内容如下:
任务式指挥:作为应用目标,使指挥官能够同步和集成所有作战力量要素;
移动和机动:通过移动和使用部队,取得对敌人和其他威胁的相对优势的相关任务和系统;
火力:在全作战域范围针对竞争对手产生和集成打击效果,实现跨军事行动范围的作战;
情报:了解敌人、地形、天气、民用因素和作战环境的其他重要方面;
保护:保护部队的相关任务和系统;
保障:保障指提供物流、财务、人事、医疗等后勤保障,以确保行动自由、扩展作战范围和延长作战时间。
基于作战职能概念的数据产品与生产者数据域的对应关系如下表所示:
基于生产者数据域的陆军概念数据产品示例
结语
美国陆军《统一数据参考架构》是基于数据网格的战略级和系统级的数据架构设计指南。未来,该架构将以基层作战人员为核心,依托各领域,并以数据产品为基础,加速人员、流程、技术和管理政策的执行速度,通过此统一的数据架构,实现陆军现有装备、系统及人员的一体化信息语义环境,并影响联合部队的行动。
目前,用于联合作战的联合全域指挥控制数据集成层设计基于陆军的统一数据参考架构,专注于推动跨域平台数据集、数据产品、多跳网络服务、多域数据服务、数据平台以及终端用户服务的一体化进程。因此,该架构将有效促进联合全域指挥控制数据层面的集成、处理和应用。
编译:川
声明:本文来自电科防务,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。