【智库声音】算法战与人工智能作战应用的实现

导读:更多精彩推荐,请关注我们 基于军事抵消或者不对称手段进行的对抗作战有可能赢也可能输。在大国竞争、对手技术优势和战区不断扩大的背景下,传统军事抵消手段经常得到人工智能(AI)的增强。然而,美国国防部当前使用人工智能进行作战的能力还处于萌芽阶段。...

更多精彩推荐,请关注我们

基于军事抵消或者不对称手段进行的对抗作战有可能赢也可能输。在大国竞争、对手技术优势和战区不断扩大的背景下,传统军事抵消手段经常得到人工智能(AI)的增强。然而,美国国防部当前使用人工智能进行作战的能力还处于萌芽阶段。五角大楼的初始人工智能计划侧重于将商业人工智能能力转移到国防部门,突出了技术性能但缺乏面向任务的功能。其最初的试点项目无法移入现实作战环境(OE)。

1实现人工智能作战应用

要使人工智能具备作战能力,首先要理解这一点,即人工智能不是一种最终状态,而是实现军事优势的一种方式。为此,人工智能相关方法的技术执行必须与作战环境相结合。这种考虑与传统思想不同,以往开发的人工智能解决方案通常是为了达到某个统计阈值(例如查全率、精确度),而不是为了达到某个军事目标(例如增加远程投射距离)。

“算法战”将技术特征和军事特征融合到一起,使得对人工智能作战化应用的理解更混乱。算法战意在减少处于危险环境的作战人员数量,提升时间紧迫的作战行动的决策速度,以及在不能人工作战的时间和地点作战。然而,这些目标中没有一个属于数学或计算机科学的内容,而是完全基于军事最终状态。目前的问题在于,在五角大楼踏上其“人工智能轨道”之前,并未建立起科学、技术、工程和数学与军事最终状态之间的连接桥梁。

理想的桥梁是指导和评估人工智能作战化应用的一种架构,一方面是算法性能,另一方面是任务效用。两者相结合确保了数学计算可以证明或从数字方面验证人工智能系统,同时确立定性基准保证实际应用。算法战不仅基于统计数据,还基于更广泛的作战相关性架构,这种相关性体现在以下五种需求中:

最低限度可行性

适应未知和不可知情况的能力

优先于信息的洞察力

应用所需的自主水平

战场准备

这类需求为评估军事人工智能项目和定义项目是否成功奠定了基矗

2

技术方法与国防条令相结合

发展军事人工智能项目的效能评估标准(Measures of Effectiveness,MOE)需要将研究和技术方法(例如基础理论)对应到美国国防部的条令。没有这种对应,算法战就会被简化为算法开发过程,而非作战部署。举例来说,设计用于检测视频中对象(例如地理空间情报分析)的计算机视觉算法被简化为模型找到的车辆数量或模型找到这些车辆的准确程度。算法在85%的时间里正确找到车辆的结果就被认为是成功。

但是在军事行动中在85%的时间里探测到车辆有什么作用?这里需要考虑具体情景。以上面的例子为例,评估同样的算法不是看它正确检测车辆的频率,而是看它对任务的影响:该模型使得分析师识别感兴趣车辆的速度提高了95%。这种方法将算法设计的优劣与其任务部署联系起来,虽然看起来像是常识,而且这种关系甚至可能在项目文档中模糊提及,但是它在国防部的任何工作中都没有一个单一的表示标准。

评估标准仍然需要保持解决方案的独立性,即无论智能类型、使用的算法、部署作战环境或任务要求如何,这些标准都应该适用。因此在这项研究中,人工智能原则表述为与系统和项目无关的可量化的属性和指标。评估标准也以一种“通过或不通过”的方式表达,以创建一个与美军相关的联合出版物一致的的、自上而下的逻辑层级,从而形成规范、监控和评估国防部人工智能系统的基线。

3一种实现国防人工智能作战效用的框架

如上文所述,具备作战能力的人工智能是由任务效用的五个方面定义的人工智能,即最低限度可行性、适应未知和不可知情况的能力、优先于信息的洞察力、应用所需的自主水平以及战场准备。每一条效能评估标准都是实施算法战的基矗分析这些信息可以为每一种效能评估标准确立一个指标和效用综合框架,整个框架以条令定义和程序为基矗

3.1 效能评估

军事效能评估过程依赖于一个“通过或不通过”的自上而下结构。这意味着,只有当一项衡量标准的每项指标都存在时,该衡量标准才存在。同样,只有当一个指标的所有效用都存在时,该指标才存在。这是一个二元的、“全有或全无”的过程,可以像应用于常规军事活动一样轻松应用于人工智能。

在常规高价值目标(HVT)寿命模式分析中,一条效能评估标准定义军事战役的一个期望结果,例如HVT移出责任区(AOR)。必须满足该效能评估标准的所有既定指标,才能避免判定成功时的任意性和选择性。例如,智能应表明:在新责任区中探测到HVT;在新责任区中探测到已知HVT关联;以及HVT在新责任区中获得基本的生命支持系统(如遮蔽、运输)。随后的效果评估遵循相同过程:支持“在新责任区中探测到HVT”指标的效果标准可能包括识别到已知物理特征和探测到通信信号。

因此,尽管传统的和人工智能的效能评估在战术执行上有所不同,但决策验证的基础系统相同。只有在对人工智能领域有基本了解的情况下,人工智能效能评估标准才能得到验证,作战部队当前还不能验证情报部门开发的效能评估标准。

3.2 使用技术手段描述效能

算法战是通过人工智能手段进行的战争。这些手段不仅具有智能(收集和应用洞察力),而且是人造的(以人类不能运作的方式作用于智能)。没有人工干预,系统必须学会如何自己表征数据,另一个表示此意义的术语是机器学习。机器学习有不同类型,但是当涉及到战场领域时,无监督机器学习凭借其灵活性和从未知和非结构化信息中推导出输出的能力将成为黄金标准。在这一标准中,深度学习方法具有独特的更精确地表示复杂问题的能力。鉴于战场的动态特质,这一能力至关重要。

因此,算法战只能通过以下这样的工作系统实现:从未知和不可知场景中(无监督)自己学习(最低限度可行),同时在很少或没有指导(自主)和在实时任务环境(战场准备)将复杂的战场环境转化为有用洞察力(深度学习使能)。这些效能评估标准以及下图(图1)中展示的架构是实施人工智能作战应用的第一步,它们为如何将技术和作战因素结合起来奠定了基础,同时也为所有人工智能项目确立了“成功”标准。

图1 算法战(人工智能)效能评估

3.3 人工智能的运行必须发挥作用

最低限度可行性测试算法战是否能够正向改变作战环境。“正向改变作战环境”意味着存在竞争优势和性能改进,证明人工智能部署是合理的。这种合理性证明来自行业标准(技术因素)、与类似系统的对比以及对人类操作员的效用。

以翻译为例,如果一种自然语言处理算法满足以下三个条件:行业度量标准证实它准确实现基本事实数据与正确语言的互译;该算法优于相同技术等级和作战环境下的其他可用算法;以及机器翻译优于人工,则该自然语言处理算法将具有最低限度可行性。

与最低限度可行性相关的竞争优势和性能改进因素也是必要的,没有它们,非算法战会更有效,从而也就否定了人工智能作战化需求。

3.4 系统具有灵活性、自适应性

由于无监督算法具有灵活性,即使在未知场景下也能获得洞察力,所以非常适合现场任务。简而言之,无监督系统可以在没有预定信息的情况下运行,并在新信息可用时进行学习。

以与对手交战为例,部署军队士兵直到战斗结束后才知道战斗应该如何展开。然而,期望的场景是他们在没有预警的情况下能对对手火力做出适当的反应,并得出关于新的敌对移动和行动的相关结论。

成功的算法战项目需要展现出军队士兵在战术执行上相同的适应性和随着时间推移的学习能力。

3.5 降低任务复杂性

深度学习可以降低复杂性。在现场任务中降低复杂性需要考虑的是如何表征和理解信息。正如人工方式一样,有效的算法战基于模式探测、推理和解决问题。

模式探测本质上是获取知识,然后将知识泛化到预测未来未知场景。假设一名部署在机场的非航空兵部门的士兵看到一架直升机在头顶飞过,并注意到了直升机如整体尺寸或双旋翼等独特物理特征。这些独特特征使该直升机区别于其他型号的机体,随着时间的推移,该士兵可以使用掌握的视觉线索从整个机队中选出正确的直升机。人工智能以同样的方式识别视觉模式,随后观察反复学习直升机的特点,然后将这些特征进行泛化,以区分各种直升机与非直升机。

推理进一步完善知识获取过程,发现环境中的细微处,并在逻辑上把这些细微处联系起来。例如,如果从未在特定的天气模式下见到过直升机,推理过程将推断该天气(作战环境的次要因素)会影响飞行能力。有了人工智能,恶劣的天气会增加辅助证据,证明没有旋翼的飞行物体不是直升机。

最后,后续的问题解决过程将一个大问题(例如如何驾驶直升机)分解成更小的问题(例如飞行路线是什么、有多少燃料可用、需要多少飞行员等)。因此,如果不降低复杂性,算法战就不能将信息转换为洞察力。

3.6 作战应用不依赖于指导

由于算法战假设利用非人工手段,人工智能必须独立构建和裁定行动过程,并且必须根据自己的决策、反应和态势感知来完成裁决。

决策是在环境中制订和解决选择问题。在常规环境中,指挥官面对相互冲突的情报、监视和侦察飞行路径,将开发资产优先级矩阵,然后根据这些需求消除冲突。这不仅只是产生可行选项,还要找出这些选项中哪一种对整体任务最为有利。为此,系统必须能够融合决策标准,例如资产数量、收集需求、飞行时间等;必须有传感器来定义决策标准,例如飞机燃油表或人工/语言提示。然后,必须对所有可用选项进行裁剪。最后,系统必须识别当前状态中的变化,并对该变化产生的新信息做出响应(即航空资产在站时间即将结束,因此不再需要消除冲突)。

这种响应补充了决策,也就是系统是否能在所需的时间线上对它从未见过的场景做出适当的响应。要做到这一点,系统必须具备态势感知的必要功能,即摄娶处理、迭代和行动。所有指标共同确保人工智能的作战应用能改善决策时间线,而不会起反作用。

3.7 实现人工智能战场应用

战场战备状态是衡量系统能否在现场任务空间中运行的标准。由于任务限制繁多,如果不预先考虑人工智能在现实世界中的运行方式,就无法在实验室中开发人工智能。显然实验室人工智能的局限性不会被战场所规避反而会被放大。开放架构受到军事基础设施的限制。“烟囱式”的传统系统造成了管道的不可知。一旦部署到前沿,泛在高速网络就会变成零散分布或断断续续。访问受限的用户群体会取代没有明确限定的商业领域专家群体,而这些用户几乎不具备人工智能专业知识。

简而言之,人工智能必须补充而不是扰乱正在进行的作战。解决任务限制从一开始就必须包括解决与现有系统的集成和通信问题。此外,还应该对该集成进行测试或鉴定,在部署之前证明它的效用(以及该效用的左/右限制)。测试认证过程很大程度上与军事人员部署能力认定或导致不可部署的不适应性测试过程一样。

总体而言,具备作战能力的人工智能的五项效能评估标准代表了初始和完全作战能力(IOC/FOC)的标准阈值。利用效能评估框架中的决策门做出的IOC/FOC决定将加速人工智能运用,并提升美国在算法战领域的定位。

3.8 架构建议

如果没有一个支持算法战的人工智能作战框架,美国国防部目前的计划将会失败。本文提出的框架是第一个定义国防人工智能领域“成功”的框架,将为政府监督提供必要的问责措施。

本文的研究目标是算法战解决方案,还需要更多研究。未来应进行拨款,将该框架级联到具体系统、学科和项目。为了支持这项工作,获取保密材料和保密系统的定量实验结果将至关重要。定量实验不仅有助于验证本文的论述,还可以开始创建一个网络来比较和改进国防领域人工智能的测试和评估。也就是说,在多个环境、系统和问题集之间持续、一致地使用效能评估架构将使人工智能项目遵循一个单一、通用的评估框架。为此,本文中提出的效能评估架构支持两个功能:通过迭代改进“通过或不通过”决策门结果来实现更有效系统,以及通过比较各自的效能评估结果对不同系统进行决策。

从战略上来看,图1中的架构应该整合到美国国防部的采购、技术和后勤流程中。当前范式并非针对人工智能项目的指数级增长和非传统性质而建立。围绕主流评估标准调整美国国防部当前和未来人工智能解决方案将实现标准化,同时加快冗长的采购流程。此外,负责企业人工智能活动的组织应该在其工作中实现框架标准化,以便更快将应用研发转化为作战效用。

不过,组织的努力不应该仅仅停留在政策上。目前,美国国防部没有利用军事人员进行人工智能活动的机制。具体来说,当前没有与人工智能相关的军事职业专业(MOS),也没有为人工智能项目识别和分配技术熟练人员的官方系统。这导致缺乏同时精通人工智能和作战任务的人员。建立一个类似于网络领域的数据学科或面向人工智能的军事职业专业,将使人工智能的作战应用更具可持续性。合格军事人员数量的增加还将扩大已认证人工智能专业人员的小规模人才库。传统的军事职业专业也可能能够适应现代战争的特点。例如,在多智能融合普遍存在的情况下,特定学科的情报分析师可能并不重要。修改或增加人工智能技能标识符或专业化将抑制军事职业专业相关性的降低。

从战术上来看,五角大楼对人工智能的推动需要伴随着一场彻底的运动,这样采用人工智能的组织就不会被简单地赋予一种没有作战背景的能力,而是在作战中发挥积极作用,利用这些能力抵消敌方优势。基层工作可能包括在初始和完全作战能力设计计划之前,在战术分队层面进行影响分析和压力测试,以了解漏洞并确定需求的优先级。

4 结语

实现具备作战能力的人工智能本质上是以任务为中心的努力,这种努力必须在战术上有意义,才能进一步产生战略影响。在对地面分队的投资获得切实回报之前,算法战的价值仍旧存疑。这也将导致让对手获得越来越难以战胜的优势。

如果没有一个实施人工智能作战应用项目的框架,美国国防部就不能继续开展这些项目。本文提出的体系架构有助于加速和规范政府工作,通过高度创新、具有作战吸引力的技术来发展人工智能能力。