本文发表于《指挥信息系统与技术》2024年第1期
作者:钟赟,张杰勇,蔡明,万路军,李军
引用格式:钟赟,张杰勇,蔡明,等 .影响网在作战行动过程优选中的应用[J].指挥信息系统与技术,2024,15(1):51-58.
摘要
影响网(IN)作为一种典型的概率网络建模方法,广泛应用于作战行动过程(COA)优选。首先,分析了IN相比于其他概率网络方法的优势,概述了基本IN在COA建模与生成中的应用;其次,从机制拓展和功能拓展两个角度出发,综述了拓展IN的研究现状;然后,分析了不确定性下的COA优选问题以保证其鲁棒性和适应性;最后,对基于IN的作战COA优选研究进行了展望。
0 引言
作战行动过程(COA)确定了实现特定作战目标需执行的所有行动,以及这些行动的串行、并行和交叉等组合和时序关系,并以此作为作战资源调度的输入,实现行动-资源需求和供给的匹配。COA的建模与生成是完成作战计划拟制的重要步骤,其生成质量将直接影响后续计划拟制,并关乎整体作战效能的发挥。因而,对于COA建模与生成的研究,一直是国内外研究人员广泛关注的研究热点。
在序列化行动的制定过程中,所有行动之间存在复杂的时序逻辑和组合逻辑关系,这使得处理规划过程中的冲突变得十分复杂,仅依靠人工方法较难制定出高效、无冲突的COA,而需采用更加自动化、智能化的技术手段。目前,美军在多次战争实践中,不断对COA建模与生成的条令体系、组织流程和实施方法进行完善。经过多年研究,国内研究人员已初步摸清外军,特别是美军COA建模与生成的基本理论和方法,并基于经典规划、层次任务网络、概率网络、知识工程、决策理论、综合评价以及深度强化学习等方法开展了广泛深入的研究。这些方法各有优劣,具有各自的适用范围。
目前,基于概率网络(一种将概率论与图论相结合的方法)进行COA优选是研究热点之一。常用概率网络方法主要包括随机Petri网和贝叶斯网络(BN),在COA建模领域,Petri网和BN方法均具有一定的应用缺陷:Petri网需建立行动完整模型,且需与其他方法结合使用;BN高度依赖条件概率表(CPT),而CPT的合理构建有一定困难,且随着问题规模的增大,CPT中节点数量随之增多,进而降低概率推理的计算效率。为克服以上问题,乔治梅森大学的Chang等根据Noisy-Or方法引入因果强度逻辑(CAST Logic)参数代替BN中的CPT,对BN改进得到IN建模方法,仅需采用一对CAST参数即可表征指定2个节点间的因果关系。
本文针对IN及其在作战行动过程优选应用问题,先分析了基本IN应用于COA建模与生成的情况,再对不同机制和功能拓展下的IN进行了综述,然后从鲁棒性和适应性2个方面概述了不确定性下的COA优选,最后给出了研究展望。
1 基本IN的应用
IN是一种新型建模工具,可以有效分析复杂系统中可控节点对目标节点的影响程度大小,具有如下优点:1) 综合考虑了不同状态可控节点对目标节点的影响;2) 模型推理所需参数较少,仅需可控节点的先验概率、目标节点的基准概率和节点间CAST;3) 模型的拓展性较强,可根据实际问题建模的需要,在机制和功能上进行拓展。
基于IN进行COA建模与生成是将己方行动、敌方行动、期望效果和阶段效果抽象为节点,将节点间的因果关系抽象为边,以己方行动、敌方行动的先验概率、中间效果和期望效果的基准概率以及节点间因果关系大小作为输入,通过从根节点到叶节点的概率传播计算不同作战行动及其序列导致不同期望效果的实现概率,并选取满足约束条件的最优期望效果对应的COA进行输出。
基于IN进行COA建模与生成较好反映了基于效果作战(EBO)的思想,本质是一种逆向规划方法。主要包括模型建立与模型求解2个部分,模型建立又可细分为因果关系建模和优化问题建模。通过因果关系模型、优化问题模型和模型求解算法的相互迭代实现COA的生成:一定求解框架下的求解算法可以产生满足优化问题模型各项约束条件的输入,在一定输入下通过因果关系模型推理出各期望效果的实现概率,模型求解算法根据各期望效果的实现概率进行下一步迭代产生新的输入,通过不断迭代优化直至生成最终COA。基于IN的COA建模与生成研究基础理论、框架和思路如图1所示。
图1 基于IN的COA建模与生成研究基础理论、框架和思路
图2 基于IN的COA模型
在IN概率推理过程中,若不能保证节点先验概率的一致性,则可能导致违反Bayes规则及概率理论。为避免这种情况,Zaidi等设计了一类分析框架对节点影响关系进行设计和分析,并建立无限制性独立假设的IN综合理论,进而通过先验概率的一致性确保满足Bayes规则及概率理论。此外,概率传播算法的设计至关重要,不同研究者根据研究需要设计了不同概率传播算法,但缺乏在效果节点与关键参数因果关系单调性方面的合理性分析和验证。相关文献采用如下概率传播算法,并在理论上证明了期望效果实现概率与其他关键参数的相关关系,即与敌方行动出现概率呈负相关关系,与期望效果的基准概率、影响强度值呈正相关关系。
在COA优选方面,Haider等提出优选COA的几种典型性能指标,并采用启发式算法和进化算法(EA)相结合的方法对COA优选模型进行求解,进而生成多个可选COA。乔治梅森大学基于IN开发分析软件PYTHIA,并成功应用于COA建模评估领域。
2 IN的机制和功能2种拓展
在实际应用过程中,基本IN不能完全满足建模需要,需进行一定拓展,主要包括机制拓展和功能拓展2个方面。
2.1 IN的机制拓展
在基本IN中,节点间的因果关系描述机制相对简单,不能描述节点间的时间机制、条件机制和传递机制等复杂机制。针对该问题,研究人员分别进行了相应改进和拓展。
图3 基于TIN的COA模型
田伟等基于随机时间影响网(STIN)(一种针对TIN中时间延迟的随机特性进行机制拓展的方法)在存在复杂时间延迟的因果关系建模基础上,开展了联合火力打击动态武器目标分配研究。Lindstrøm等针对TIN中“与”逻辑和实际问题“或”逻辑不匹配问题引入逻辑门概念,解决TIN在逻辑表征的不足,建立逻辑时间影响网(TINL),并设计了TINL转化为着色Petri网(CPN)的机制方法。
实际上,作战过程是连续动态的,己方行动和敌方行动会随着战场态势的变化不断演进,从而导致基于基本IN的COA模型不能有效表征参数变量的动态演变过程。Haider等在影响强度值更新过程中引入记忆环和非平稳机制,建立动态影响网(DIN),拓展了基本IN在刻画影响强度值动态时间依赖性的功能。姚佩阳等在COA策略优选过程中,采用DIN进行问题建模并给出概率传播参数的一致性条件,并采用学习型遗传算法(LGA)进行优化求解。基于DIN的COA模型如图4所示。
IN的机制拓展是针对实际问题特性进行的研究改进,有效克服了基本IN在实际问题因果关系描述机制方面的不足。但实际问题可能需进行多种描述机制的复合,这是下一步研究的重点。
图4 基于DIN的COA模型
2.2 IN的功能拓展
基本IN在COA建模中的核心功能是进行概率推理,节点状态主要为0-1二值状态,但对于实际复杂系统,节点状态可能为多值状态。此外,基本IN概率推理过程中存在较多假设前提,例如,节点间影响强度值是先验确知的,敌方行动也是事先确定的,这些前提与实际情况并不完全相符,需进行相应拓展研究。
基于IN进行COA建模的过程中,网络学习算法设计是重要问题,包括结构学习和参数学习2个方面:结构学习确定了COA建模中各节点的定性和定量影响关系;参数学习是已知网络结构确定网络参数的过程。目前COA建模问题中,网络结构一般通过领域专家经验直接给出,可通过关键链路的灵敏度分析方法,采用动作集查找算法(SAF)进行边删除后的节点联合概率分布计算,与Kullback-Leible散度算法相比,SAF算法的区分度更高,更有利于IN建模较优结构的学习生成。SAF算法本质上是一种基于贪心机制的爬山算法,其优势在于算法复杂度较小且易于实现。Haider等针对IN中叶节点的非线性和事件发生与否的二元性,构建了结构学习的混合整数非线性规划(MINLP)模型,并采用数学编程语言(AMPL)这一常用代数建模工具进行模型求解,该模型也被证明是进行IN结构学习的有效方法。
IN参数学习是根据样本数据对网络中关键参数的概率分布进行估计的整体过程,朱延广为克服极大似然估计方法不能有效利用先验知识的缺陷,在数据量充足的理想情况下,采用Bayes估计方法对STIN中关键参数进行学习。对于节点状态为多值状态的参数学习,孙建彬等按照数据处理与采样、参数初始化与种群编码、参考值与CAST参数解码以及训练数据集推理等步骤,基于微分进化(DE)算法对参数学习模型进行求解,并通过测试数据集验证了方法的有效性和优越性。Sun等将IN进行相应功能拓展,使之适用于多属性、多状态复杂系统建模,并建立CAST参数优化模型,通过对历史数据的学习训练有效提升了参数学习的近似率。
作战活动是敌我双方强烈对抗的活动,如果在COA制定过程中仅考虑我方行动,而不考虑敌方的对应活动,则不能完全体现作战活动的敌我博弈过程。杜正军等在基本IN基础上考虑敌我博弈及资源博弈,建立基于序贯博弈IN的COA优选模型,采用标准矩阵对策进行求解,与未考虑博弈情况对比后发现,考虑博弈情况的COA优选方法更符合实际情况。在此基础上,陈超等将IN和博弈论相结合,考虑敌方行动策略确定和不确定2种场景,分别建立多阶段博弈模型和高阶超博弈模型,根据敌方可知或可能决策结果确定己方行动决策。当然,虽然建模过程中考虑因素更加全面,但同时也引入了更多条件假设。
虽然IN在机制和功能上进行了相应拓展研究,但由于IN本身的局限性,难以有效表征行动的时序关系和反馈机制等,需开展更深入的拓展研究。
3 不确定性下的COA优选
有效性和最优性是对作战COA的基本要求,然而,在任何形式战争活动中,“战争迷雾”均是挥之不去的,这决定了对不确定因素的辨识、表征、分析和处理是COA建模与生成中的核心课题。由于不确定因素的影响,计划阶段性能最优的COA可能在实施阶段并非最优,甚至不再有效。针对COA建模与生成中的不确定因素,有研究人员采用前摄式(Proactive)和反应式(Reactive)方法开展相关研究:Proactive方法基于鲁棒性理论使得制定的COA对不确定因素不敏感;Reactive方法基于适应性理论通过对COA的适时适量调整使其适应当前战场态势。这些对作战COA提出了新的要求,即鲁棒性和适应性。
3.1 COA优选的鲁棒性
鲁棒性的概念来源于统计决策理论,用于对一些决策问题进行灵敏度分析,若决策结果对某函数变化不敏感,则称对该函数具有鲁棒性。将鲁棒性概念引入COA建模与生成,就是要在多重不确定因素影响下,生成连续稳定可执行且对摄动脱敏的COA。实现COA鲁棒性的技术途径主要为基于冗余技术、基于模型设计技术和基于不确定优化技术3种。COA鲁棒性实现途径如图5所示。
图5 COA鲁棒性实现途径
基于冗余技术包括行动冗余和资源冗余2种途径,即通过设置冗余行动和资源,确保在不确定因素影响下有可应对或抗不确定因素能力强的行动和资源进行处理,从而间接提高COA的鲁棒性。
基于模型设计技术包括目标设计和约束设计2种途径。前者是在模型目标函数中引入鲁棒性指标,即原优化目标函数值的方差值,与原优化目标值共同构成目标函数的最优性指标和鲁棒性指标,并通过多次蒙特卡罗(MC)仿真,在优化过程中实现COA最优性和鲁棒性的均衡;后者是在模型约束条件中加入必须满足的鲁棒性约束,即首先定义COA的鲁棒性测度方式及其阈值,进而在优化过程中确保COA的实际鲁棒性测度指标不能小于预先定义的鲁棒性阈值,使得COA的鲁棒性能够维持在一定程度。
基于不确定优化技术指针对COA生成过程中涉及的随机参数和区间参数等多种不确定参数(指因果关系模型和优化问题模型中的各类参数),分别采用随机优化和区间优化方法进行处理,从而提升COA鲁棒性的方法。因果关系模型中的参数包括可控节点的先验概率、目标节点的基准概率和节点间的影响强度值等;优化问题模型中的参数包括特定作战阶段行动数量阈值、特定期望效果实现概率阈值等,根据实际问题建模结果,优化问题模型中的参数类型有差异。由于前者涉及因果关系模型中的关键参数,故通过因果关系推理过程会直接影响COA概率推理生成结果;后者是在因果关系推理结果生成基础上,通过优化问题模型的目标函数优化和约束条件满足性的判断(在某些参数取值下可能违反约束条件),间接影响COA概率推理生成结果。
随机优化需要不确定参数的概率分布作为输入,优化过程中不能保证约束条件在任何一组参数组合下都得到满足,但能够限制违反约束的概率小于一定阈值。换言之,随机优化能够以一定概率确保COA在不同的不确定参数组合下实现较优,从而确保COA的鲁棒性。与随机优化不同,区间优化无需获取参数概率分布信息,仅需明确参数取值的上下限,并基于区间优势度、可能度和序关系等方法实现区间数排序。在此基础上,通过迭代优化确保生成的COA在不确定参数的整个取值空间都保持较优,使得COA能够有效应对相应参数的变化,即有效提升COA的鲁棒性。
无论是随机优化还是区间优化,均需考虑参数的不确定性,在参数的概率分布范围或取值分布区间内进行整体优化,确保生成的COA在所有参数组合下都能实现优化,从而取得最优性和鲁棒性的折中。换言之,传统优化方法仅考虑在特定参数组合下的COA最优性,但不能保证参数发生变化时COA的质量;采用随机优化和区间优化方法,虽然可能在特定参数组合下生成的COA最优性不如传统优化方法,但由于考虑了不同参数的整体概率分布和取值分布情况,使得在所有参数组合下的COA生成质量能够得到保证,即确保了COA的鲁棒性。孙昱等针对战役级鲁棒计划生成问题,考虑模型参数为区间参数,根据区间数理论对优化算法进行改进,并基于区间序关系对多目标问题模型进行直接求解,能够以较少信息输入实现优化结果的鲁棒性。
目前对于COA优选鲁棒性的研究,存在研究系统性不足、场景样式设计不够多样难以充分验证鲁棒性性能,以及缺乏不同鲁棒性实现途径的横向对比等问题,需进一步研究。
3.2 COA优选的适应性
社会学、生物学、管理学和复杂性科学等学科研究人员均对系统(体系)适应性开展了相关研究,COA优选的适应性指能够根据作战任务和环境变化进行COA演进重构的能力。根据幅度和时效的不同,实现COA适应性的技术途径可分为全局重构和局部演进2类。其中,前者指在各类条件发生变化时,将当前战场信息作为输入信息,不考虑预先COA优选结果,从无到有地重新生成适应当前战场信息的新COA;后者是在考虑预先COA优选结果基础上,在其解邻域范围内进行局部拓展搜索,从有到优(这里“有”是相对于原有战场信息而言)地进行适应当前战场信息的COA优选。
万路军针对航空集群COA在线优化问题,在IN通过参数学习完成概率分布更新后,基于滚动时域(RHP)框架,通过对模型结构优化并从可行的行动策略中计算得到最佳的COA,实现了COA全局更新。基于RHP框架的COA适应性演进流程如图6所示。
图6 基于RHP框架的COA适应性演进流程
何华针对TIN较难融合新信息的特点,将TIN转化为动态贝叶斯网络(DBN)进行信息融合,并给出行动概率时变条件下TIN→DBN的转化算法,采用DBN进行概率推理后实现了COA的局部调整。
目前对于COA优选适应性的研究,存在适应性实现途径拓展不足、场景样式设计不够多样难以充分验证适应性性能,以及COA适应性难以满足实际作战需求等问题,同样需要进一步研究。
4 研究展望
作为具备良好特性的建模工具,IN能够较好应用于COA建模。通过对相关研究成果的分析,归纳总结COA优选的难点主要包括基于敌方计划识别的COA优选、基于关键行动链路的COA优选和不确定条件下的COA优选3个方面,具体如下:
1) 基于敌方计划识别的COA优选。现代战争充满高度对抗性,但“知己知彼、百战不殆”的战争法则仍然有效适用。对敌方计划的快速准确识别是我方进行行动规划的重要基础。可以综合建立相应描述框架和流程方法,采用基于知识、学习和推理等的集成方法,提高对敌方意图识别的准确率。
2) 基于关键行动链路的COA优选。在对敌方计划进行识别基础上进行我方COA的优选,综合采用因果追溯分析和灵敏度分析方法,确定对期望效果影响较大的我方行动进而确定完整行动链路,并通过集约高效行动组合达成同等或可接受作战效果。
3) 不确定条件下的COA优选。虽然当前已有针对不确定条件下COA优选研究,但相关研究还未成体系,需进一步研究。重点是基于最小变更原则,对COA优选适应性中局部的调整策略开展研究,以及采用不确定多目标优化方法,对基于不确定优化技术的COA优选鲁棒性策略进行研究。
5 结束语
作战COA优选是作战筹划和任务规划等指挥控制技术的核心内容。围绕该问题,基于IN进行COA建模与生成是当前的研究热点。本文针对基于IN的COA优选进行研究现状分析,概述了基本IN及其机制拓展和功能拓展的研究进展,分析了不确定性条件下COA优选鲁棒性和适应性实现途径,并从敌方计划识别、关键行动链路确定和不确定性条件3个方面出发,提出下一步研究方向。本文的研究工作梳理、健全了基于IN的因果关系建模功能体系,完善了不确定因素下提高COA优选鲁棒性和适应性的理论体系和技术途径,可为具有高度对抗性和不确定性战场环境下的作战COA优选研究提供参考。
声明:本文来自防务快讯,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。