2024年,美国兰德公司发布《人工智能和机器学习在防御性太空对抗中的应用——决策支持工具能力验证》报告,研究了人工智能/机器学习(AI/ML)作为防御性太空对抗任务决策支持工具的适用性,并对发展防御性太空对抗AI/ML工具提出了建议。本文编译了报告的主要内容。
图1 《人工智能和机器学习在防御性太空对抗中的应用——决策支持工具能力验证》报告
1 引言
2019年,兰德公司的空军计划部门承接了美太空军委托的一项研究工作,评估能否将AI/ML工具用作决策辅助工具,帮助作战人员从现有的天基作战方案中迅速选出适用的方案,以保卫和防守已被敌方确定为攻击目标的太空系统。该项工作采用自定义方法实现了典型的生成式对抗网络(GAN)体系架构,并在此基础上开发了初步的AI/ML决策支持原型工具。本次发布的报告对2019年的AI/ML决策辅助工具进行了改进。
2 对AI/ML决策辅助工具的技术改进
防御性太空对抗工具由两部分组成。第一部分是一个可访问的网页式用户界面,用于浏览太空对抗决策环境。第二部分是一个后端AI/ML决策支持模型。用户界面与后端模型通信,后端模型针对用户界面中指定的红方防御性太空对抗挑战提供经过优化的蓝方响应。
2.1 改进建模仿真
项目组重组了现有模型的代码,以提高其可维护性和可扩展性。首先将先验模型从Octave移植到Python中,以适应建模仿真结构、AI/ML算法和用户界面之间的接口技术。在不改变建模仿真结构外部特性的情况下,将其功能细分为各个模块,既简化了基础逻辑,又消除了代码冗余。在此过程中,定期对建模仿真结构进行输出验证,以确保其性能与先前的项目相匹配。项目组还在模型中加入了双曲线开普勒方程,因此模型可以评估更多挑战和响应轨迹。
2.2 改进AI/ML模型体系架构
2019财年开发的AI/ML决策支持模型(见图2)基于一个生成式对抗网络(GAN)体系架构。该体系架构包括一个生成器G(.),该模型与一个判别器D(.)进行交互,从而使经过调整的生成器实现有用的模仿行为。该模型的核心理念是,如果模型学会了模仿数据集中的各种“正确”响应,最终训练出来的模型就会成为一个有效的蓝方策略模型。结果证明,该策略只取得了相对成功。模型学会了提出有效响应,但这些响应未必总是非常有效。
图2 生成式对抗网络模型示意图
改进后AI/ML决策支持模型从原来主要基于GAN的体系架构,转而采用单一时间步长的参与者-评价者算法强化学习(RL)体系架构。这种新型模型体系(见图3)保留了对抗性子组件路径(红线),用于训练模型,以学习场景的有效内部表征和蓝方响应。但是,在基础模型结构上增加了第二条信号路径(蓝线),如果蓝方在现实世界中执行了所生成/提议的响应,该路径会估算蓝方的回报。使用这种“评分估算器”模型,可以通过一种称为梯度下降的迭代数学算法来更新蓝方的响应策略模型。因此,通过增加一个额外项,修改了学习目标;这个额外项可激励策略模型,求出评估员算法预期评分的最大值。为此,将更新后的模型称为RAGAN-P。
图3 改进后的RAGAN-P模型示意图
更新后的RAGAN-P模型体系整合了用于检查有效性的传统参与者-评价者算法强化学习体系架构(如图3黄色方框所示),以及用于有效性评分的奖励增强型生成式对抗网络体系架构(如图3红色方框所示)。这种混合型体系架构能更好地体现作战方案和场景的内部结构,同时还能生成高分的蓝方响应作战方案。
3 防御性太空对抗工具的工作流程
防御性太空对抗工具的使用可以分为三个步骤:(1)指定红方挑战;(2)从AI/ML工具中抽取蓝方响应方式示例;(3)描述各个蓝方响应方式的时延特征。
(1)步骤一:指定红方挑战
首先要求用户选择目前正在进行的红方挑战。如图4所示,红方备选作战方案包括直接升空或子轨道攻击。这种工具的作战部署需要将任何其他相关的红方威胁作为可选项。此类部署还依赖于太空态势感知(SSA)数据管道,以自动选择红方作战方案。如果不能直接传送及时且适当的太空态势感知数据(如红方拦截器轨迹),该工具的有效性可能会大打折扣。无论使用哪种工具或方法,均需利用及时和相关的太空态势感知数据来制定蓝方作战方案。
图4 在仿真页面上,系统提示用户选择一项红方作战方案
一旦选择了红方作战方案,就必须通过选择该作战方案的详细参数(如燃尽速度和燃烧终止点弹道倾角,在图5中显示为“推进后的”速度和角度)来定义该方案。在运行仿真之前,需对参数进行验证,以确保红方挑战具有可行性。点击“验证红方挑战”按钮(图5底部)可检查所选红方作战方案的参数是否代表有效的红方挑战。如果是,该工具就会绘制拦截轨迹曲线图。如果不是,该工具会显示失败消息,并且不提供蓝方作战方案。如果挑战有效,则进入下一步(点击图5底部的“运行仿真”按钮)。
图5 系统提示用户为直接升空拦截作战指定红方参数
(2)步骤二:从AI/ML工具中抽取蓝方响应方式示例
点击“运行仿真”按钮后,即可将红方作战方案参数提交给后端AI/ML决策模型。该模型会生成一组蓝方响应方式。每个蓝方响应方式都是为应对相同红方挑战而设计的有效潜在作战方案。蓝方行动实例包括操控受攻击的卫星、部署诱饵或发射护卫卫星拦截攻击导弹。每种蓝方作战方案都会获得一个任务效能评分、响应方式所需的加速度或速度变化,以及其他信息,例如部署的诱饵数量。
为了让用户了解模型建议的整体有效性,模型会生成关于整个蓝方响应方式组合的有效性柱状图。图6显示了针对一种红方作战方案的100个AI/ML生成的蓝方响应方式有效性评分样本分布。
图6 应对红方作战方案的100个蓝方作战方案有效性评分分布图
为了让用户详细了解每种推荐的备选方案,图7列出了一些蓝方作战方案以及每个任务效能水平相应的参数值。该列表为用户和作战人员提供了一个备选作战方案“信息看板”,这些备选方案按有效性评分从高到低的顺序排列。这些蓝方作战方案示例由专为此任务设计的后端AI/ML模型生成。
图7 AI/ML模型生成的蓝方响应方式示例列表
(3)步骤三:描述各个蓝方响应方式的时延特征
点击信息看板上的某个蓝方作战方案(图7)后,会生成一张时延敏感度曲线图(如图8),用于详细说明延迟执行响应作战方案会导致的后果,即等待时间过长可能导致建议的作战方案失效。
图8 蓝方作战方案时延敏感度曲线图
4 报告提出对发展防御性太空对抗AI/ML工具的建议
4.1 对本项研究的建议
报告对防御性太空对抗AI/ML工具提出了以下发展建议:
(1)为防御性太空对抗任务的AI/ML决策支持实用工具制定相应的开发计划和指南:这类开发计划和指南可包括用户利用适当感知网格和数据来源的数据管道,对本项目中开发的更全面、更综合的工具版本进行评估,以及将该工具作为原型部署到防御性太空对抗作战中心。
(2)优先建立太空态势感知数据管道:报告认为,美太空军应开发新的或利用现有的太空数据和信号源,作为美国太空军各种决策支持工具和管道的输入信息,借助有效的AI/ML辅助决策获益。
(3)在训练美太空军的同时,部署AI/ML决策辅助工具:报告认为,美太空军需开发一个更全面的工具版本,将之作为防御性太空对抗作战人员的训练工具。这将使受训人员有机会针对太空系统的各种敌对活动选择不同的作战应对方案,并深入了解作战方案的优点和局限性。
4.2 对未来研究工作的建议
报告认为,美太空未来应开展如下工作,以支持AI/ML决策辅助工具在太空作战中的应用:
(1)研究在太空作战中运用AI/ML对作战条令的影响,为AI/ML在太空作战中的应用制定更详细的作战条令。
(2)通过投入相应的人力、物力和财力,改进人机界面,使其更加科学合理,并利用博弈论模型开发AI/ML算法。
声明:本文来自防务快讯,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。