杜蒙/编译
知远战略与防务研究所
【知远导读】俄罗斯“军事思想”杂志2023年第11期刊载了普罗塔索夫、希尔马诺夫、拉德马诺夫等3人共同撰写的文章《人工智能技术开发及对潜在侵略国的威慑作用》。文章介绍了现代人工智能技术的发展趋势及在军事领域的应用,并分析了其可能对国家战略威慑力产生的影响。
文章全篇约7400字,篇幅所限,推送部分为节选。
具有超强杀伤力的核武器问世之后,即成为战略威慑的杀手锏。随着近年来人工智能技术不断取得突破性进展,战略威慑现在又多了新的王牌。人工智能技术对威慑战略的影响将是巨大的,而且具有两面性。一方面,人工智能技术会促使对抗双方都担心对手能够准确预测本方的敌对行动,因此都不会轻举妄动。从这一角度讲,人工智能技术似乎强化了威慑效果,促进了战略稳定。但另一方面,人工智能技术或许也会促使对抗双方产生盲目自信和冒险倾向,从而造成冲突风险在无意中升级。
研究表明,预计在2025-2030年间,人类有可能创造出一种所谓的“通用(强)人工智能(Artificial General Intelligence,AGI)”,它可以从根本上改变现代战争样式,并成为与核武器并列的威慑战略的决定性因素之一。那么,随着人工智能技术的突飞猛进及其在军事领域的普遍应用,在不久的将来,利用人工智能技术实施威慑战略的效果将会如何?核武器是否将不再是唯一可靠的安全保障,发展核武器是否将不再是明智之选呢?这些都是值得思考的问题。
在可以预见的未来,人工智能技术将可能从根本上改变常规作战方式,军事行动的筹划和实施方式,以及敌我双方兵力兵器、基础设施、地形地貌等信息的收集和使用方式,同时在军事活动的各个领域发挥威慑作用。本质上讲,人工智能技术的军事应用,不单纯是使用某些特定的设备、硬件或软件,更重要的是,它将给威慑战略带来重大改变。例如,军事行动期间,人工智能技术可以改变预期成本和效益的计算,消除态势评估的不确定性,提高决策的合理性,减少兵力兵器的损失,此外,还能改变进攻和防御手段之间的平衡,甚至对常规武器和核武器完成威慑任务的能力做出新的研判。
综上可知,人工智能技术可以完全排除人类情绪和其他生理限制的影响,确保威慑行动的决策不出现偏差,并提供基于不同来源实时信息采取行动的方案,这将大大提高威慑战略的正确性和果断性,加快从数据分析向定下政治、军事决心,进而加快实施全球或区域性威慑行动的推进速度。
人工智能技术在自动化文本处理系统中的应用
目前,人工智能技术已在军事领域突显了高效率性,特别是在利用神经网络自动化系统(子系统)处理从侦察设备(以下简称“自动化信息收集系统”)实时获取的图像、视频、音频、无线电、水声等各种传感数据过程中。不过需要强调的是,如果将人工智能技术引入处理非结构化文本信息的自动化系统(以下简称“自动化文本处理系统”,广泛用于各级军队指挥及信息处理),那么情况则截然不同,甚至适得其反。主要原因在于,对于自动化信息收集系统和自动化文本处理系统而言,在神经网络技术的成熟度方面,存在很大差异:在自动化信息收集系统中,人工智能神经网络技术最常用于识别视觉图像,此时其技术成熟已经达到6-9级(根据P57194.1-201612和P58048-201713号国家标准,6-9级的技术成熟度对应从模型和原型制作到批量生产准备的试验设计阶段)。例如,在“第一人称视角”无人机(FPV:First Person View)等无人巡飞弹药上安装的自动制导系统。然而,在自动化文本处理系统中,计算机视觉技术对于自然语言文档的语义构建、语义搜索等文本信息服务,是不适用的。目前,自然语言处理神经网络技术的成熟度只有1-3级,换而言之,这些技术尚处于科学研究阶段。然而,恰恰是自动化文本处理系统,才将在人工智能技术的军事应用中发挥关键作用。
截至目前,人工智能技术在自动化文本处理系统中的应用尚处于研究开发阶段。对于俄罗斯联邦武装力量而言,当下面临的一个主要障碍,是没有任何经过实践检验的现成方案可供使用。相比之下,美军在这方面却已领先了一步,甚至利用乌克兰武装部队在军事行动中测试了融入人工智能的自动化文本处理系统,例如,Palantir Technologies Inc.公司的Palantir态势感知系统。根据2023年7月初的一则报道,美国军方已经在大型语言模型(LLM)的基础上对自动化文本处理系统进行了成功测试。之前查询某个特定部队的信息可能需要占用工作人员几个小时,但在此次测试过程中,一个人工智能设备在10分钟内就完成了查询任务。旧金山初创公司Scale AI自称其新产品Donovan是测试自动化文本处理系统的平台之一,但美官方并未予以确认,也未对外公布到底是何种大型语言模型参与了测试。不过可以确定的是,美军设定的长期目标,是利用人工智能数据,以及来自各种传感器的信息,针对是否使用和如何使用杀伤性武器做出决策。为此,包括Palantir Technologies Inc.和Anduril Industries Inc.在内的数十家公司正在加紧为五角大楼开发基于人工智能的决策平台。
值得注意的是,文本处理技术近年来取得飞速进步。5年前,BERT、GPT、DALL-E等基于超大型文本语料库的1000亿参数以上的神经网络预训练(基础)模型(FoundationModels)横空出世,为创建快速扩展随机树(美国OpenAI公司“ChatGPT”系列的大型语言模型)提供了条件。这些神经模型展示了解决最广泛问题的能力,全面显示了所谓的“通用(强)人工智能”的特质。
大型语言模型是通过专家教练反馈强化(人类反馈强化学习)等多种方式,借助预训练(基础)神经网络模型创建的。当前,Yandex. Dialogues,Mail.ruAgent,SistemmaGPT,Botmother,Chatfuel,Gigachat,Bingo,MidJourney等ChatGPT的系列衍生产品,正如雨后春笋般先后面世,在全球广为流行。因此,我们有理由推断,在不久的将来,这种预训练(基础)神经网络模型和大型语言模型的“后代”可能迎来爆炸性增长。整个庞大的神经模型“家族”将通过所属公司,以及众多的科研爱好者,以各种各样的方式,教授和传播各个领域的知识、技能。
当前人工智能技术的发展动态,预示着未来3-5年内通用(强)人工智能就有可能问世(这比以往预测的时间会提前许多),因此需要高度关注并持续展开深入的分析研究。这一点,对于提高现有军用自动化系统的效率,有着极其重要的意义。
图1:大型神经网络模型的形成过程
大型语言模型向通用(强)人工智能的进化
实践表明,大型语言模型不仅支持问答模式的文本对话框(包括Microsoft的Bingo和Yandex的Alice等原始链接),而且还在解决几何和其他逻辑问题,以及根据文本描述生成图像等方面迈出了关键一步。正因如此,大型语言模型开始拥有了通用(强)人工智能的属性,不仅能够识别、建构和理解“所读所见”的含义,而且能够推断出新的结论,合成新的认知,包括在之前没有涉猎过的未知领域。但需要注意的是,大型语言模型的这种能力与聊天机器人使用的各种现代化语音助手的理性言语能力非常相似,严格来说,并不是“理性意识”。
而提起“理性意识”就不得不谈到“第二信号系统”。众所周知,第二信号系统是人类高级神经活动的一个专有特征,根据I.P.巴甫洛夫的理论,“词语”是“具体信号的信号”,可对人类大脑产生特定的刺激,能够通过反映现实物体、周围世界及其联系,使人脱离具体的对象和现象,形成抽象思维。由此可知,“第二信号系统”的完整模型只有在能够“有意识地(合乎逻辑地)”将单词、词组等作为表义符号(概念或实例)运用时,才开始具备各种逻辑转换的能力,并真正地(理性地)进行推理。
但无论如何不可否认,现代大型语言模型在解决逻辑问题方面已经取得了巨大成功,如今它既可以分析解决问题,还可以演绎推理,得出新的结论,合成新的认知。值得一提的是,大型语言模型向通用(强)人工智能进化的速度,将不仅取决于其基础神经网络结构本身的能力,更取决于将这种结构用于教育实践的效果。可以预期,人类在过去几个世纪里积累的大量教育方法和“经验”都将得到更加广泛的应用,例如在编程教育等领域。
逻辑人工智能与神经网络人工智能科技半成品的结合运用
“逻辑(符号)人工智能”和“神经网络人工智能”,是人工智能技术的两个重要分支。其中,逻辑人工智能,是解决问题的通用程序,能够根据几何学原理证明所有定理、逻辑程序设计语言、专家系统,以及所有与它们相关的知识库、逻辑模型、产生规则、语义网络等;而神经网络人工智能,是通过模拟人脑的神经网络来实现类人工智能的机器学习技术,现阶段通常被看作是“弱人工智能”(narrow artificial intelligence)。
近几十年来,逻辑人工智能和神经网络人工智能领域科技半成品的结合运用,展现出相当大的潜力。从发展趋势上看,“Reinforcement Learning Human Feedback(即人类反馈强化学习系统)”向“Reinforcement Learning Expert System Feedback(即专家反馈强化学习系统)”的升级将很快启动,与此同时,人类在电子计算机问世以来多年间所开发的大量其他逻辑模型也都将得到广泛应用。
然而迄今为止,逻辑人工智能系统都无法克服一种“通用缺陷”。换而言之,虽然这些系统可以给出解决问题的正确方案和建议,但需要满足一个必要条件,即:输入到这些系统内的所有单词和词组,都必须完全被随后用于各种公式(例如,谓词代数)的涵义所替换。不过,“专家神经网络模型”却能够克服逻辑人工智能的“通用缺陷”,也就是说,这种模型可在自动模式下成功解决对输入数据流中的文本及图像、视频、音频、无线电、水声等其他形式语义对象的初始“识别(认知和建构)”问题。此外,通过逻辑概念转换,“专家神经网络模型”还能够准确无误地分析(包括演绎推理)之前没有涉猎过的未知领域,尔后借助现有的多模图像形式的“引物”,成功地进行“合成”,克服“逻辑人工智能”系统的“维度诅咒”,并获得顿悟能力。相信在不远的将来,“专家神经网络模型”将能够获得通用(强)人工智能必备的特性,即:能够自行推理,同时为了继续深入学习而自行寻找书籍和交流对象,从而独立解决更加广泛的问题,并解释推理过程。
此处有必要对“顿悟”这一概念作以解释。“顿悟”曾被卡尔·邓克尔和马克斯·韦特海默用来表示人类思维的一个特性。根据该特性,问题的解决是基于对问题的整体抽象理解,而不是通过具体详细的分析来实现的。还有另一种观点认为,“顿悟”是依靠直觉,在无意识状态下寻找问题解决办法的过程。
在军事领域,利用专家神经网络模型或通用(强)人工智能,可以不间断地处理大量作战数据、发现敌军行动中最细微的变化、自动解决物理和网络空间内的指挥问题,从而加速数据的收集与评估,以及决策的做出与实施进程,并保证精确度和可信度。正因如此,人工智能技术的应用将使各级军事指挥人员的工作效率大大提高,主要体现在:
一是能够帮助分析人员从不同侧面发现信息的之间重要的隐形联系,挖掘出难以识别的信息异常;
二是能够将分散的信息片段快速拼接,并呈现在决策者和战斗员所需要的态势感知图中;
三是能够提高军事指挥机关在军事筹划、作战训练、兵力部署,以及后勤、通信、动员等方面的能力;
四是能够更好地协调组织军事训练和实施军事行动,使得战略威慑框架内一些特别复杂的措施更具合理性和可行性。
另外,利用人工智能技术实现数据分析自动化,将使军事指挥机关和整个武装力量在决策环节形成对敌优势,即:一方面,可以确保数据的近乎实时处理,在更短的时间内为决策者提供更多的信息和行动选择;另一方面,透过对敌军以往行动模式和特点的分析,结合当下实际,科学预判敌军的下一步行动,并采取先发制人的措施。从长远趋势来看,通用(强)人工智能将取代人类,基于对战术、战役和战略层面大量数据的全面分析评估,为决策者提供各种合理的选项,从而促使决策者将包括目标选择在内的一系列重要任务都转交给计算机来完成。一旦出现这样的局面,冲突中的防御方大概率会采取先发制人的措施,影响或遏制进攻方的行动。不过,随着时间的推移,当发现对手正在使用人工智能判定自己的行动时,进攻方也可能不会采取任何非必要的行动。这也正是人工智能技术能够强化威慑效果和促进战略稳定的原因。
声明:本文来自知远战略与防务研究所,版权归作者所有。文章内容仅代表作者独立观点,不代表安全内参立场,转载目的在于传递更多信息。如有侵权,请联系 anquanneican@163.com。