电子电气工程与控制

无人集群协同感知鲁棒性智能评估方法

  • 沈博 , 1 ,
  • 马倩 1 ,
  • 张志翔 1 ,
  • 杨刚 1 ,
  • 贾伟 2
展开
  • 1. 西北工业大学 计算机学院,西安 710129
  • 2. 西安爱生技术集团有限公司,西安 710065
.E-mail:

收稿日期: 2025-04-15

  修回日期: 2025-04-21

  录用日期: 2025-05-22

  网络出版日期: 2025-06-13

基金资助

国家自然科学基金(61902295)

国家自然科学基金(62141220)

Intelligent evaluation of robustness of unmanned swarms in cooperative sensing scenario

  • Bo SHEN , 1 ,
  • Qian MA 1 ,
  • Zhixiang ZANG 1 ,
  • Gang YANG 1 ,
  • Wei JIA 2
Expand
  • 1. School of Computer Science and Engineering,Northwestern Polytechnical University,Xi’an 710129,China
  • 2. Xi’an ASN Technology Group Company,Xi’an 710065,China
E-mail:

Received date: 2025-04-15

  Revised date: 2025-04-21

  Accepted date: 2025-05-22

  Online published: 2025-06-13

Supported by

National Natural Science Foundation of China(61902295)

摘要

无人集群已经广泛渗透并深刻影响到了现代社会的各个领域。在任务执行过程中,无人集群可能面临多种干扰和破坏,这会影响集群的正常运行及任务的高效完成。开展集群鲁棒性评估的研究,对于提升集群在动态环境下的行为协同稳定性与任务完成高效性,具有重要的理论意义与应用价值。以无人机集群协同感知为应用场景,根据场景任务中的协同行为特性,采用鹰鸽演化博弈建模集群协同过程,从集群属性、环境属性和任务效果3个维度构建无人机集群鲁棒性指标集,提出了鲁棒性量化指标,分析了集群在不同攻击场景下的鲁棒性。将沙普利加和解释与极端梯度提升树模型相结合,构建具有可解释性的鲁棒性智能量化评估模型。实验结果表明,所提出的鲁棒性评估方法具有良好的可行性和有效性,提升了评估模型的透明度,能够为无人集群优化设计提供有效反馈。

本文引用格式

沈博 , 马倩 , 张志翔 , 杨刚 , 贾伟 . 无人集群协同感知鲁棒性智能评估方法[J]. 航空学报, 2026 , 47(1) : 332118 -332118 . DOI: 10.7527/S1000-6893.2025.32118

Abstract

Unmanned swarms have widely penetrated and profoundly affected all fields of modern society. In the process of mission execution, unmanned swarms may face a range of interferences and damages, potentially affecting their normal operation and mission efficiency. Therefore, evaluating the robustness of swarm has important theoretical and applied value to ensure the stability and efficiency of the swarm in the dynamic environment. This paper focuses on cooperative sensing of the UAV swarm as an example. Based on behavioral characteristics of swarm cooperation, the cooperation process is modeled using the Hawk and Dove evolutionary game. A robustness indicator set of UAV swarm is constructed from the three dimensions: swarm attributions, environmental attributions, and task effects. Quantitative robustness metrics are proposed, and the robustness performance of the swarm under various perturbation factors is analyzed. An intelligent evaluation model eXGBoost based on the Shapley additive explanation and the eXtreme Gradient Boosting model is proposed. The experimental results show that the proposed robustness evaluation method is both feasible and effective. In addition, the method increases the transparency of the evaluation model, providing effective feedback for the design of unmanned swarms.

无人系统是人工智能最重要的应用领域之一,近些年随着人工智能的发展已渗透到人类生产生活的诸多方面。随着需求场景的日益复杂,无人系统集群化已成为必然选择。无人集群通过高效信息共享,实现任务的动态分配与协同执行,提升了任务执行效果。然而在高度动态环境中,无人集群可能遭遇设备失效、环境干扰、蓄意攻击、能源不足等突发状况,这些不确定因素可能严重影响任务的执行。无人集群鲁棒性是指集群即使在个体发生故障或存在外界干扰的情况下能够坚持完成目标任务的特性。如何评估无人集群在复杂环境下的鲁棒性,以便设计合适的鲁棒性提升方法,成为无人系统关键技术研究与优化设计一个亟待解决的问题1-2
无人集群鲁棒性评估面临诸多挑战。集群由多个互连的无人系统通过一定的分布式协同、智能决策等技术进行整合,使其呈现出单个系统所不具有的集群能力,其行为交互难以通过传统模型进行准确描述,增加了准确定义集群鲁棒性的难度。此外,不同场景中的系统能力及鲁棒性的表现形式存在显著差别,集群协同呈现跨域、非线性、时变耦合等特点,鲁棒性的评估还需要考虑各种潜在的故障模式对集群协同造成的不同影响,进一步增加评估的复杂性。
复杂网络与演化博弈的结合为无人集群协同机制的研究提供了一个有效理论框架。复杂网络可以描述无人集群的拓扑关系,将无人设备抽象为节点,各设备之间的关系和相互作用抽象为边。利用复杂网络建模无人集群拓扑,分析无人设备如何通过边进行信息传递和资源共享,能够为优化集群的协同效率和任务协同能力提供依据。在无人集群中,个体需要在有限资源下进行任务选择与决策,演化博弈能够建模资源分配和任务分工过程,促进集群高效合作,引导无人集群在复杂环境中达到稳定的协同状态3-4。复杂网络上的演化博弈有效描述了个体间相互依赖、动态适应、资源分配的动态过程,为无人集群鲁棒性评估提供了分析依据。
本文结合无人机集群协同感知场景,对集群鲁棒性评估方法进行研究。首先利用鹰鸽演化博弈建模集群协同,建立集群协同演化框架;其次,根据集群特性,构建无人机集群鲁棒性多维度指标集,并提出集群鲁棒性量化模型;在此基础上分析不同干扰场景对集群鲁棒性的影响;最后,建立鲁棒性的智能评估方法,并结合SHAP框架构建评估指标-评估结果关联关系分析方法,从全局以及局部视角分析指标的作用机制,为无人集群的优化设计提供有效反馈。

1 相关工作

1.1 基于博弈论的集群协同建模研究

无人集群协同是指集群成员通过信息共享共同完成预定任务,该过程不仅要求个体能够独立运行,还需要个体能够有效与其他成员协调、合作,实现整体目标。不同无人设备在交互过程中,个体利益往往相互冲突。博弈论强调个体策略的相互依存,侧重多个体行为间相互影响的分析,能够体现合作与冲突的关系,与无人集群协同目标契合,因此成为研究群体交互协同的一种有效框架5。演化博弈作为博弈论中的重要分支,将经济学的“均衡观”与生物学的“适应性”相结合,刻画了个体在有限理性和信息不完全的情况下,如何通过不断学习、模仿和试错来优化行为,最终达到稳定状态,用演化博弈理论解决无人集群协同问题具有理论价值和现实意义。目前,已有学者利用演化博弈研究群体分工合作问题6-7
1) 结合马尔科夫随机过程研究混合均匀种群的演化稳定状态及合作策略占优条件。Su等8使用图建模种群的空间结构,提出了一种带有博弈切换的演化动力学模型,共享边的个体通过在每个时间步进行博弈,以决定下个时间步中的策略,结果表明,博弈转换对集群演化过程具有重要作用。Du等9研究了愿景驱动动力学下两方博弈占优条件,通过在随机网络和规则图上进行分析,证明愿景驱动不会改变不同种群结构的演化结果。此外,Jiang等10基于雪堆博弈研究惩罚机制对合作演化的影响。然而,混合均匀种群意味着种群内个体之间可以进行信息交换,是一种理想的状态,并不符合实际场景,Sun等11研究了如何降低马尔科夫过程种群合作策略评估的复杂度问题。然而,无人集群在执行任务过程中,通常是按照一定的编队形式执行任务,这类方法很难对集群编队进行建模。
2) 基于图论研究种群的演化动力学过程及合作机理。Ohtsuki等12发现博弈效费比(合作行为的收益与成本的比值)与平均邻居数的关系将会影响群体策略的选择,如果博弈效费比大于平均邻居数,群体倾向于合作,这一规则适用于多种拓扑结构。Su等13提出一种博弈转换演化动力学框架,即不同博弈模式对应不同环境状态,个体的行为和当前时间步的博弈共同决定下一时间步的博弈。他们基于这一框架进一步研究了群体网络结构的演化,提出了边嵌入的对估计方法,并结合扩散近似,建立了网络上合作演化的一个基本判据:合作行为能够演化的条件是博弈效费比超过平均邻居数量与博弈切换影响的差值。Fu等14假设个体位于规则网格上,通过更新策略分析了雪堆博弈和囚徒困境下的集群合作现象。随后,他们并进一步讨论了博弈互动在同质和异质网络上带来的演化差异15。Pena等16研究了基于图的多人博弈,并采用Moran过程进行策略更新,结果表明,具有图结构的群体比缺乏空间结构的群体更易形成合作。

1.2 无人集群鲁棒性评估研究

Leonard和Levin17认为鲁棒性是群体智能的基础。无人集群鲁棒性评估的意义不仅在于检测集群在面临挑战时的应对能力,还在于通过量化集群的行为和性能,提前发现潜在的风险点和瓶颈问题。鲁棒性评估的核心目标是通过对集群的行为、状态和外部环境的深入分析,确定其在突发状况下的适应能力和任务完成能力。
由于无人集群在某些个体发生故障时能否完成预期任务通常取决于底层通信网络的完整性,因此鲁棒性可以通过分析集群拓扑结构如何随着节点和边的移除而发生变化来分析。Albert等18利用2种攻击方式,包括随机删除网络上的节点模拟随机失效,以及删除度最大的节点来模拟网络受到蓄意攻击,分析了随机网络和无标度网络两种拓扑的鲁棒性差异,并采用连通性对网络鲁棒性进行评估。Iyer等19利用潜在重要性度量定向删除节点,分析其对各种网络结构的影响。Tian等20将针对复杂网络的连续攻击建模为部分可观测马尔可夫决策过程,提出一种此条件下的强化学习方法,分析在网络信息不完整时复杂网络受到连续攻击下的动态鲁棒性,并在无标度网络和小世界网络上验证了该方法的性能。
由于部分复杂系统被认为是一种多层网络,具有多种功能相关性,单层复杂网络不能完整描述其特性,因此单层网络的鲁棒性评估方法不能完全应用于多层网络系统。Buldyrev等21研究了相互依存的多层网络节点被移除时导致的故障级联现象,强调在设计稳健系统时考虑相互依存网络特性的必要性。Bilal等22提出了分层复杂网络在定向攻击下的鲁棒性量化方法,并构建鲁棒性指标分析了10个真实世界网络。Wang等23考虑了无人机集群的动态演化,提出了一种基于三层复杂网络理论的无人机集群系统鲁棒性评估方法,并建立了综合鲁棒性指标和2种评估策略,为无人机集群的鲁棒性设计、任务规划和决策提供一定的指导和参考。
基于博弈论的评估方法能够刻画多个个体的交互演化过程,行为动力学为系统评估提供了更多更详细的信息24-25。然而,这类方法聚焦于多智能体强化学习相关算法评估,虽然提供了一套完整的行为分析框架,但距离真实无人机、无人车等集群系统评估还具有较大的差距。无人集群系统涉及系统的软硬件设计,需要综合分析系统的多个维度才能做出准确评估。无人集群行为遵循OODA模型,包括观察(Observation)、判断(Orientation)、决策(Decision)和行动(Action)4个阶段,该模型刻画了集群根据环境状态做出动态行为全过程。然而,基于博弈论的方法在评估时缺乏从个体及群体OODA能力角度开展分析,无法基于评估结果给出更加有效的反馈意见以指导系统的优化设计。因此,有机融合集群行为演化分析和经典的系统评估学是准确评估智能无人集群鲁棒性的有效途径。

2 无人机集群协同感知系统模型

2.1 协同感知场景描述

无人机集群作为一种新兴的城市感知解决方案,具有灵活的机动性和高效的数据采集能力26。如图1所示,在智慧城市的交通监控场景,多个无人机部署在城市重要路段和交通枢纽实时获取交通流量、车速、事故等信息,并通过实时数据分析提供动态交通决策。
图 1 无人机集群协同感知场景

Fig.1 Collaborative perception scenario for UAV swarm

假设集群由多个通感算一体无人机组成,共同执行交通监控任务。无人机具备动态适应能力,可以选择2种策略:数据采集或数据分析,每架无人机能够根据环境变化实时调整自身策略。数据采集范围是以该无人机为圆心的圆形区域,无人机能够监测此区域内的交通数据。然而,若相邻无人机均选择同种策略,可能出现无数据来源或数据重合现象,造成不必要的资源浪费。因此在该场景中,集群控制目标是协调多个无人机的行为,使相邻无人机采取不同策略,避免数据采集重复冗余的同时提升数据分析有效性,从而实现广泛区域的高效监控。

2.2 基于鹰鸽博弈的无人机集群建模

在无人集群分工协同问题时,某些任务并不需要所有无人节点均采取相同策略,而是尽可能使相邻位置的平台采取不同策略,以节约成本,例如火力打击作战问题,此时若全部投放弹药会造成资源浪费。这一过程映射到博弈即为博弈双方持相同策略所获收益低于分别持不同策略,与鹰鸽博弈思想较为类似。标准的鹰鸽博弈描述了鸟类捕食场景,当2只鹰同时发现食物,会发生斗争导致两败俱伤;当2只鸽子同时发现食物,会一起分享食物;当鸽子和鹰相遇,鸽子会逃走,食物被鹰独享。因此,当鸟和鹰相遇时,最优策略是充当鸽子的角色,虽然无法获得收益但也不会造成损失;如果鸟和鸽子相遇,那它应充当鹰的角色独享食物获取最大收益。在鹰鸽博弈中,个体的最优策略是选择对手的相反策略。表1列出了无人机集群协同感知任务与鹰鸽演化博弈相关概念的映射关系。
表1 概念映射关系

Table 1 Concept mapping relationships

无人机集群协同感知 鹰鸽演化博弈
无人机集群 结构化种群
单个无人机 个体节点
数据分析(策略 A 鹰策略
数据采集(策略 B 鸽策略
不同策略下无人机的收益 博弈收益
无人机之间基于收益的策略转换 策略迁移
采用不同策略的无人机在集群中占比动态变化 动态演化
无人机策略趋于稳定 演化稳定
假设无人机按照不同拓扑结构分布在矩形监控区域内,相邻无人机的距离不超过其通信距离 R c,无人机的感知距离为 R z。无人机集群表示为 1,2 , , n,策略集为 A , B,其中策略 A表示数据分析,策略 B表示数据采集。初始时,无人机随机选择策略,各策略占比均为50%。每个时间步,无人机 i与其所有邻居进行博弈。如果无人机 i和邻居同时选择策略 A,由于缺乏感知数据,则认为这2个节点的收益为0;若其邻居选择策略 B,即数据采集,无人机 i能够及时处理邻居的感知数据,是最理想的协同状态。假定在此协同中,采集数据和处理数据的收益分别为 R c o l R a n a,邻居的成本包括数据采集成本 C c o l和数据传输成本 C t r a n。考虑到无人机间的数据采集区域可能重合,数据重复造成资源浪费,因此本文引入重叠成本 D c o l D a n a,则邻居的收益为 R c o l - C c o l - C t r a n - D c o l,无人机 i的收益为 R a n a - C a n a - D a n a,其中 S o v e r l a p为重叠感知区域大小, D c o l D a n a的定义如下
D c o l = α S o v e r l a p         α < R c o l - C c o l - C t r a n π R z 2
D a n a = β S o v e r l a p          β < R a n a - C a n a π R z 2
如果无人机间没有重叠感知区域,则无人机收益分别表示为 R c o l - C c o l - C t r a n R a n a - C a n a,则单位面积的收益表示为 R c o l - C c o l -   C t r a n / π R z 2 R a n a - C a n a / π R z 2。如果重叠部分完全没有收益,则该区域重叠成本为 R c o l - C c o l -   C t r a n S o v e r l a p / π R z 2 R a n a - C a n a S o v e r l a p / π R z 2。由于重叠部分不会完全没有收益,重叠成本满足上述公式约束。
如果无人机 i选择策略 B,即数据采集,若邻居选择策略 A,则其收益如上所述;若其邻居同样选择策略 B,数据分析未发生,没有数据传输成本,其二者收益为 R c o l - C c o l - D c o l ,,其中 D c o l ,定义为
D c o l , = σ S o v e r l a p          σ < R c o l - C c o l π R z 2
综上所述,可以得出 R a n a - C a n a - D a n a > R c o l - C c o l - D c o l , > R c o l - C c o l - C t r a n - D c o l > 0,满足鹰鸽博弈形式,其收益矩阵如表2所示。
表2 收益矩阵

Table 2 Payoff matrix

策略名称 策略 A 策略 B
策略 A 0 R a n a - C a n a - D a n a
策略 B R c o l - C c o l - C t r a n - D c o l R c o l - C c o l - D c o l ,
在每个时间步内,假设无人机 i共有 k个邻居,选择策略 A的邻居数为 k A,选择策略 B的邻居数为 k B , k A + k B = k,则无人机 i的收益定义如下
F S i A , B = R a n a - C a n a - D a n a k B k                                                                       S i = A R c o l - C c o l - C t r a n - D c o l k A + R c o l - C c o l - D c o l , k B k           S i = B

2.3 基于愿景驱动规则的协同策略更新

演化博弈中的策略更新规则指定了个体如何根据环境反馈和其他个体行为策略调整自身策略,常见的规则包括Replicator dynamics规则27、Moran过程28、Fermi规则29等。相较于其他规则,Fermi规则基于个体与邻居的相对收益来更新策略,使得集群能够根据环境的变化、任务要求或集群成员的行为来动态调整策略,能够有效反映无人机在动态环境中的适应性,适用于描述无人机集群的策略更新。Fermi规则中,无人机 i随机选择一个邻居 j作为自己的策略模仿对象,其概率为
P i j = 1 1 + e F i - F j / T
式中: T表示选择噪声强度。当 T 0时,若邻居收益大于个体收益,即 F i - F j < 0,则无人机 i复制邻居 j的策略,否则保持当前策略;当 T 时,无人机 i以0.5的概率随机选择2个策略;当 T > 0时,若 F i - F j < 0,则无人机 i倾向于复制邻居 j的策略。
愿景驱动规则属于Fermi规则的特例,通过将演化博弈收益与愿景水平比较进行新的决策,个体认知起主导地位。此时,无人机 i在策略集之间切换的概率为
P S i A , B = 1 1 + e ω F i - F k i ¯
式中: ω ϵ 0,1表示选择强度,能够放大或缩小 F k I ¯的作用; F i为无人机 i的收益, F k I ¯为无人机 i所有邻居的平均收益,即愿景水平,反映了无人机 i对博弈收益的期望程度。当 F i - F k i ¯ = 0时,无人机 i选择两种策略的概率均等,均为 1 / 2;当 F i - F k i ¯ > 0时,无人机 i收益高于平均收益,无人机 i倾向于保持当前策略;当 F i - F k i ¯ < 0时,无人机 i收益低于平均收益,无人机 i倾向于改变当前策略。

3 协同感知场景鲁棒性指标构建

3.1 场景鲁棒性指标集

结合无人集群及应用场景特性,其鲁棒性评估指标可以从3个维度进行刻画:集群属性、环境属性和任务效果,如表3所示。集群属性反映了集群的能力,是无人集群鲁棒性评估的核心维度之一,直接影响到集群在面对扰动时的适应能力,包括单个无人机的能力和集群整体能力描述,是衡量无人集群任务执行过程中各类能力特征和行为的指标。环境属性决定了集群任务执行的难度,能够描述外界对无人集群的影响。无人集群的任务环境往往复杂多变,而外部环境的干扰可能会导致个体通信受阻、能耗增加,甚至影响任务的顺利完成。环境属性可以分为两类,一类描述地形环境,如区域大小、地形复杂程度等;另一类描述任务相关的干扰因素,例如故障模式、天气状况、电磁对抗类型等。任务效果反映了集群在执行任务过程中的表现,是衡量集群在特定环境和约束条件下完成任务能力的重要指标,不仅反映了单个无人机在任务完成中的表现,还体现了无人集群在协同作业下的整体效能,可以结合具体场景从任务成功率、完成时间、性能损失等角度来定义。
表3 鲁棒性指标维度

Table 3 Dimensions of robustness indicators

指标类别 描述角度
集群属性 单节点能力
集群能力
环境属性 地形因素
干扰因素
任务效果 个体效果
集群效果
根据无人机集群协同感知任务,对集群鲁棒性指标集进行实例化。假设集群中无人机是同构的,即集群内的无人机具有相同的能力。单架无人机是集群的组成单位,其内在能力是指无人机执行任务所具备的基本硬件与软件特性,而集群的整体能力不是单架无人机能力的简单叠加,还涉及集群规模、编队方式等多个层面的因素。基于此,所设置集群属性指标包括感知范围(Perception range)、通信范围(Communication range)、集群规模(Swarm size)、集群拓扑(Swarm topology)、平均路径长度(Average path length)、平均节点度(Average node degree)、聚类系数(Clustering coefficient)。
节点能力主要包括感知范围和通信范围。每架无人机都配备相同类型的传感器,如高清摄像头、红外传感器、激光雷达等,对目标区域数据采集,感知范围是指无人机的有效采集区域半径。通信范围是指无人机间进行有效通信的最大距离,确定了无人机间的数据传输和信息共享范围。
集群层面的指标包括集群规模、集群拓扑、平均路径长度、平均节点度和聚类系数。集群规模指集群中无人机的数量,直接影响了任务的执行速度和感知范围。集群拓扑确定了集群中多个无人机的组织形式,进而确定不同的协同模式,应根据任务需求、环境特征和通信能力确定。平均路径长度、平均节点度和聚类系数是复杂网络主要统计特性,也是常见的复杂网络鲁棒性度量指标。复杂网络中连接两个节点边数最少的路径称为节点间的最短路径,最短路径上边的数量表示节点间的距离。网络的平均路径长度为网络中任意两个节点之间距离的平均值
L ¯ = 2 n n - 1 i j d i j
式中: d i j表示节点 i和节点 j之间的距离。平均路径长度代表了网络中节点间的分离程度,若无人机集群具有较短的平均路径长度,意味着信息在集群中传播更快,任务分配和执行的效率更高。
节点的度定义为与该节点直接相连的边的数量。平均节点度是指网络中每个节点度的平均值,刻画了网络的连通性。设每个节点的度为 k i , i 1,2 , , n,则平均节点度表示为
k ¯ = 1 n i = 1 n k i
若无人机集群的平均节点度较大,即使一些节点失效,其他无人机仍能通过其他路径保持连通,此时集群鲁棒性更优。
节点的聚类系数是指节点邻居之间实际存在的连边数量与最大可能连边数量的比值。假设节点 i k i个邻居,则这些邻居的最大可能连边数量为 k i k i - 1   / 2。若 E i表示邻居节点实际存在的连边数,则该节点的聚类系数定义为
C i = 2 E i k i k i - 1  
网络的聚类系数为网络中所有节点聚类系数的平均值
C ¯ = 1 n i C i
聚类系数较高表明集群中无人机之间能够产生更多的局部协同,有助于提高集群在执行复杂任务时的协同性和鲁棒性。
假定该场景为开阔无障碍环境下的协同感知,忽略地形因素维度指标,环境因素指标由干扰因素构成,一种为故障场景,设置为故障模式和故障节点比例,另一种为通信受限场景,设置为通信延迟和延迟时间步,环境属性指标包括故障模式(Failure mode)/通信延迟(Communication delay)和故障节点比例(Failed node ratio)/延迟时间步(Delay time step)。
故障模式是指内外部因素导致设备失效或性能下降的不同形式,包括未故障、随机故障和目标故障。集群初始状态为未故障,随机故障是集群中的无人机节点随机受到干扰破坏,目标故障则是攻击者有意选择特定无人机攻击。由于任务分配、通信结构或节点功能的不同,目标故障可能对集群的任务执行造成严重影响。故障节点比例是指失效无人机在集群规模占比:
R f a i l e d = n f a i l e d n 11
式中: n为集群规模, n f a i l e d为失效无人机数量。
在通信受限情况下,集群之间个体的信息交互发生延迟,主要表现为交互的延迟时间步。在集群协同场景,延迟时间步 τ可以定义为信息从发送方无人机传输到接收方无人机所需的时间。
结合场景特性,选择节点平均收益、感知面积比值作为任务效果指标。节点平均收益是指在集群演化到稳定状态后,集群中每个无人机所获得的平均收益如下,其中 P i是指各无人机的收益
P a v e = i = 1 n P i n
感知面积比值量化了集群在遭遇干扰后感知能力的变化,由干扰后集群稳态的感知面积 S i n t e r与未干扰时集群稳态的感知面积 S比值表示为
R a r e a = S i n t e r S

3.2 无人机集群鲁棒性量化定义

根据前文构建的指标集,结合无人机集群拓扑特性,对集群鲁棒性进行量化定义。在设计鲁棒性综合评价指标时,选取感知任务效果、平均节点度归一化值、聚类系数归一化值三项作为核心指标。设集群初始状态演化稳定时感知面积为 S,节点被攻击或引入通信延迟后集群演化稳定时的集群感知面积为 S i n t e r,集群感知面积比为 S i n t e r / S。令平均节点度为 k ¯,最小节点度为 k m i n,最大节点度为 k m a x,聚类系数为 C ¯,最小聚类系数为 C m i n,最大聚类系数为 C m a x,度量权重分别为 ω 1 ω 2 ω 3,均在0~1之间且满足 ω 1 + ω 2 + ω 3 = 1,则鲁棒性综合评价指标定义如下
R G = ω 1 S i n t e r S + ω 2 k ¯ - k m i n k m a x - k m i n + ω 3 C ¯ - C m i n C m a x - C m i n
权重 ω 1 ω 2 ω 3的物理意义具体如下。
ω 1(感知任务效果的权重):体现无人机集群在遭遇扰动后,集群感知任务完成度对鲁棒性的贡献,该指标与集群完成核心任务的能力直接相关,是评估鲁棒性不可或缺的因素。
ω 2(平均节点度归一化值的权重):体现集群网络连通性对鲁棒性的贡献,平均节点度越高,说明集群内部通信更加畅通,有助于集群信息的高效传递和协同响应。
ω 3(聚类系数归一化值的权重):体现集群局部协同能力对鲁棒性的贡献,即集群内部局部拓扑结构稳定性对鲁棒性的贡献,聚类系数越高,表明无人机之间的局部协作越紧密,对抗局部故障和扰动的能力越强。

4 不同集群拓扑下的集群鲁棒性分析

4.1 无故障场景

在任务执行过程中,无人集群拓扑直接影响集群的协同效率、任务完成情况及对干扰的适应能力。为了准确评估不同编队拓扑下的集群行为,考虑3种集群网络模型,即社团网络、规则网络和随机网络。社团网络中集群被分为若干个紧密连接的子集群,子集群内部无人机联系紧密,各子集群间的联系较弱。规则网络是常见的无人机集群编队形式,无人机之间以固定、规则方式建立连接,适用于对无人机位置具有严格约束的场景。随机网络中无人机间连接关系是随机生成的,适用于模拟复杂环境中无人机集群的协同问题,尤其是分析动态和不确定环境中的协同趋势。
假设无人机随机分布在 100 × 100的矩形区域内,集群规模 n = 100,策略集为 A , B,策略 A表示数据分析,策略 B表示数据采集。初始时,令无人机间的通信距离 R C = 10,无人机的感知范围为以该节点为圆心,半径 R z = 5的圆形区域。令 R a n a = 9 C a n a = 4 R c o l = 4 C c o l = 1 C t r a n = 1 , α = 0.01 , β = 0.025 , σ = 0.015,基于愿景驱动规则更新策略,分析在强选择( ω = 1)条件下实验结果。
1) 社团网络
将无人机分为4个社团,社团内部联系紧密,初始时无人机以相同概率随机选择策略,各策略占比约为50%,如图2(a)所示,红色节点表示策略 A,绿色节点表示策略 B,蓝色圆圈表示无人机的感知区域。可以看到,此时策略分布较为随机,存在相同策略节点出现聚集的情况,导致集群整体收益较低。随着任务的执行,集群根据策略更新规则演化,图2(b)表示演化后的集群策略情况。各节点存在与自身策略相反的邻居,带来较大的收益。这说明,协同感知场景采集到的数据能被及时处理,符合集群协同感知需求。
图 2 社团网络演化结果( R C = 10 , R z = 5

Fig.2 Evolution results in community network ( R C = 10 ,   R z = 5

2) 规则网络
令无人机以10×10的方式规则分布在区域内,无人机间的距离为 8,初始时无人机随机选择策略,如图3(a)所示。与社团网络类似,初始时存在节点与其所有邻居策略相同的情形。经过策略演化,各节点均存在与其策略相反的邻居,实现演化稳定,如图3(b)所示。
图 3 规则网络演化结果( R C = 10 , R z = 5

Fig.3 Evolution results in regular network ( R C = 10 , R z = 5

3) 随机网络
令无人机随机分布在指定感知区域,在其通信范围内的无人机均认为是其邻居。初始时随机选择策略如图4(a)所示。经过策略演化,集群达到演化稳定,每个节点均有至少一个邻居与其持相反策略,如图4(b)所示。
图 4 随机网络演化结果( R C = 10 , R z = 5

Fig.4 Evolution results in random network ( R C = 10 , R z = 5

ω 1 , ω 2 ω 3均为 1 / 3,该情形下无人机集群的鲁棒性变化如表4所示。初始时,集群随机选择策略,感知面积重叠造成资源浪费,整体感知面积相对较小,因此鲁棒性指标 R G较低。随着策略更新,集群达到演化稳定状态,感知面积的增大提升了集群鲁棒性。
表4 不同拓扑无人机集群鲁棒性 R G的变化

Table 4 Robustness R G variations of UAV swarm in different topologies

参数 场景描述 社团网络 规则网络 随机网络
R C = 10 , R z = 5 初始情况 0.642 0.587 0.626
稳定状态 0.657 0.600 0.637

4.2 故障场景

本节从随机故障和目标故障2种情形对集群鲁棒性进行分析。参数设置与4.1节一致,考虑到博弈过程存在波动,取20次实验的平均感知面积和平均收益进行分析。
1) 随机故障
随机选择10%、20%、30%的节点作为失效无人机,在网络中删除节点及其对应的连边,分析3种拓扑结构的瞬时感知面积和平均收益,并与演化稳定的性能进行对比,结果如图5所示。节点的失效直接影响到集群整体的协同,策略分布出现失衡,感知面积和收益将会大幅度降低。由于无人机的智能特性,能够不断调整自身策略,集群再次达到稳定状态,感知面积会有所增加。由于损失了部分节点,整体感知面积有所减小,但节点平均收益不会受到太大影响,在演化稳定时仍能获得较高的收益。
图 5 随机故障下不同拓扑无人机感知面积与平均收益变化

Fig.5 Perception area and average revenue changes under random failures in different topologies

3种拓扑的集群面对随机故障的鲁棒性具体表现如表5所示,结果表明,集群具有较强的鲁棒性。由表5可以看出,随着节点删除比例的增加,网络的连通性和信息传输能力逐步减弱,集群的鲁棒性呈下降趋势。社团网络结构由于其较强的局部结构特征和较好的冗余连接,能够在一定程度上维持较高的鲁棒性。
表5 不同拓扑随机故障下无人机集群鲁棒性 R G变化

Table 5 Robustness R G  variations of UAV swarm under random failures in different topologies

场景描述 社团网络 规则图 随机图
正常情况 0.657 0.600 0.637
删除10%节点 0.637 0.540 0.586
删除20%节点 0.582 0.500 0.557
删除30%节点 0.581 0.466 0.516
2) 目标故障
目标故障是针对性地攻击集群中具有特定功能或关键作用的节点使其失效。根据场景设置,分析以下3种目标故障:删除策略 A节点,删除策略 B节点、删除度最大的节点。在协同感知中,删除节点会破坏集群的稳定状态,其中,度最大的节点是集群关键节点,具有最多的连接,承载着信息传播、资源调度等核心功能,起到枢纽作用,删除这类节点模拟了针对集群的定向打击。
参照随机故障设置,分别删除达到稳态集群的10%、20%、30%的无人机节点。图6展示了不同故障方式下集群感知面积和各无人机平均收益的变化情况。由图6可知,删除策略 A节点瞬间,集群感知面积往往不太会发生变化,删除策略 B节点瞬间,感知面积下降明显,这与节点的策略相关。另外,节点的平均收益会偶然出现增加情况,是因为网络中某些节点的角色发生变化,可能带来暂时的收益增加。当删除度最大节点时,感知面积有所下降,平均收益也随之下降,之后集群再次策略演化。
图 6 目标故障下不同拓扑无人机集群感知面积及平均收益变化情况

Fig.6 Variations in perception area and average revenue of UAV swarm with targeted failures in different topologies

面对任一故障方式,随着集群规模的减少,感知面积会逐渐减小。表6~表8反映了不同故障方式下各拓扑集群的鲁棒性变化情况。遭遇目标故障时,社团网络表现出了最优的鲁棒性。这是因为社团网络内部具有较强的模块化特征和局部集聚性,节点间的连接往往高度集中在各自的社团内,局部网络可以较好地维持稳定性和信息流通,从而保证集群在面对节点故障时的整体鲁棒性。规则网络在面对故障时表现出最差的鲁棒性,因为其节点连接具有高度的确定性和规律性,关键节点故障后,网络的整体连通性容易受到破坏,尤其是当度最大节点被攻击时,拓扑结构的脆弱性更为突出,集群的任务执行和信息传递能力显著下降。
表6 删除策略 A节点各拓扑无人机集群鲁棒性 R G的变化

Table 6 Robustness R G variations of UAV swarm with Strategy A deletion in different topologies

场景描述 社团网络 规则图 随机图
正常情况 0.657 0.600 0.637
删除10%节点 0.648 0.562 0.629
删除20%节点 0.618 0.498 0.551
删除30%节点 0.559 0.410 0.511
表7 删除策略 B节点各拓扑无人机集群鲁棒性 R G变化

Table 7 Robustness R G variations of UAV swarm with Strategy B deletion in different topologies

场景描述 社团网络 规则图 随机图
正常情况 0.657 0.600 0 0.637
删除10%节点 0.619 0.537 5 0.603
删除20%节点 0.594 0.502 0 0.522
删除30%节点 0.593 0.438 0 0.521
表8 各拓扑删除度最大节点无人机集群鲁棒性 R G变化

Table 8 Robustness R G variations of UAV swarm with maximum degree node deletion in different topologies

场景描述 社团网络 规则图 随机图
正常情况 0.657 0.600 0.637
删除10%节点 0.624 0.486 0.620
删除20%节点 0.608 0.400 0.612
删除30%节点 0.559 0.386 0.510

4.3 通信受限场景

考虑通信受限时无人机集群的鲁棒性表现,评估规模为100的无人机集群在社团网络、规则网络和随机网络3种拓扑下的鲁棒性。假设无人机按照不同的拓扑结构随机分布大小在 100 × 100矩形区域上,并以相同概率从策略集中选择策略作为初始策略,令 R c = 10 , R z = 5。发生电磁干扰后,无人机无法实时获取周边节点信息,机间通信存在延迟。假定机间平均延迟为 τ,个体决策基于延迟 τ时间步的邻居策略信息。该情况下无人机 i在策略集之间切换的概率为
P S i t A , B = 1 1 + e ω F i t - F k i t - τ ¯
式中: ω ϵ [ 0,1 ]仍表示选择强度, F i ( t )为节点 i在时间 t的收益, F k i ( t - τ ) ¯为节点 i邻居在时间 t - τ的平均收益。
τ = 5,在强选择( ω = 1)下经过多次具有延迟的集群间通信,集群达到了演化稳定状态。鉴于博弈策略存在波动性,计算二十次演化过程中的平均感知面积和平均收益作为集群演化稳定后的整体性能指标。从图7~图9可知,通信受限情况下无人机集群经过一定时间的演化后,逐渐趋向于演化稳定状态。这一结果表明,尽管通信存在限制,集群成员通过延迟的信息交互不断调整其行为策略,优化资源利用和协作效率,仍能够通过演化最终达到稳定状态。这种演化稳定性不仅反映了集群在特定通信条件下的适应能力,也表明集群能够在复杂的通信环境下,保持一定的任务执行效能和协同能力。
图 7 通信延迟时社团网络演化结果( R c = 10 , R z = 5

Fig.7 Evolution results of community network with communication delay ( R c = 10 , R z = 5

图 8 通信延迟时规则网络演化结果( R c = 10 , R z = 5

Fig.8 Evolution results of regular network with communication delay ( R c = 10 ,   R z = 5

图 9 通信延迟时随机网络演化结果( R c = 10 ,   R z = 5

Fig.9 Evolution results of random network with communication delay( R c = 10 ,   R z = 5

表9所示,不同的通信延迟虽然导致信息传递不及时,但通信链路没有中断,对集群的演化没有显著影响,集群呈现出较强的鲁棒性。
表9 通信延迟下无人机集群鲁棒性 R G的变化

Table 9 Variation of robustness R G of UAV swarm with communication delay

场景描述 社团网络 规则网络 随机网络
正常情况 0.647 0.600 0.627
τ = 5 0.646 0.598 0.625
τ = 8 0.644 0.599 0.622
τ = 10 0.645 0.596 0.621

5 基于可解释机器学习的鲁棒性智能评估

5.1 基于XGBoost的评估方法

上文的分析获得了不同场景下无人机集群协同感知鲁棒性的量化结果,本节提出从评估指标到评估结果的量化评估方法。鲁棒性指标数据集本质上属于表格数据,尽管目前针对表格数据已经提出了多种深度学习框架,但基于梯度提升决策树(Gradient Boosting Decision Tree, GBDT)的方法,尤其是XGBoost30、LightGBM31和CatBoost32,仍在该领域占据主导地位,这些算法仍被认为是解决表格数据问题的最佳选择33。XGBoost在GBDT的基础上引入了正则化项,提高了模型的准确性同时降低过拟合的风险。此外,XGBoost提供了大量可定制参数,通过参数调整可以优化模型对特定问题的求解性能。因此,本文选择XGBoost并对其优化设计,以满足集群鲁棒性智能评估的需求。
作为评估方法,既要捕捉到集群指标间的相互作用,还要满足评估场景数据分析的特殊性。例如,当集群在恶劣环境中执行任务时,不可避免地会受到通信干扰或者丢失一些数据34-35,需要采取有效手段避免模型学习到异常数据。XGBoost模型的参数可以根据输入数据和目标值进行调整,常用的调参方法,如网格搜索,本质上是一种枚举法,通过对所有可能的参数组合进行穷举,以寻找最佳的参数配置。本文引入哈里斯鹰优化(Harris Hawk Optimization,HHO)算法对XGBoost参数进行优化。哈里斯鹰优化算法36由Heidari等于2019年提出,是一种模拟哈里斯鹰捕食行为的智能优化算法。
在第1阶段,由于鹰的高度分散性,其个体随机栖息在某一位置,并以固定概率 q找到猎物。当 q < 0.5时,鹰根据其他成员和猎物的位置栖息;当 q 0.5时,鹰随机栖息在种群活动范围内的一棵树上。鹰的位置向量 X t + 1更新如下
X t + 1 = X r a n d t - r 1 X r a n d t - 2 r 2 X t       q 0.5 X r a b b i t t - X a v e t - r 3 l b + r 4 u b - l b   q < 0.5
式中: X t表示鹰的当前位置向量, X r a b b i t t表示猎物的当前位置, X a v e t表示种群中所有个体的平均位置, r 1 r 2 r 3 r 4分别为0~1的随机值, u b l b是搜索空间的上限和下限。
在第2阶段,鹰可以在不同状态之间切换,定义兔子的逃逸能量 E如下
E = 2 E 0 1 - 1 t m a x
式中: t m a x是最大迭代次数, E 0是能量初始值。在 E 1的情况下,鹰会搜索不同的区域,进一步探索猎物的位置。在 E < 1的情况下,鹰会进行局部探索。具体来说,如果 E 0从0下降到 - 1,兔子的能量就会逐渐减少。如果 E 0从0增至1,则兔子处于恢复能量阶段。
在第3阶段,鹰可以采取4种策略突袭猎物:软包围、硬包围、渐进式快速俯冲的软包围和渐进式快速俯冲的硬包围。假设 r是兔子逃跑的概率,如果 r < 0.5,兔子就能成功逃跑;当 r 0.5时,兔子逃跑失败。
r 0.5 E 0.5时,鹰会使用软包围进行突袭, J表示兔子的跳跃强度,位置更新如下
X t + 1 = X r a b b i t t - X t - E J X r a b b i t t - X t
r 0.5 E < 0.5时,鹰会使用硬包围进行突袭,位置更新如下
X t + 1 = X r a b b i t t - E X r a b b i t t - X t  
r < 0.5 E 0.5时,鹰会使用渐进式快速俯冲的软包围进行突袭,位置向量根据下式进行更新
X t + 1 = Y       F Y < F X t Z      F Z < F X t
Y   =   X r a b b i t t -   E J X r a b b i t t -   X t  
Z = Y + S × L F D
式中: D表示空间维度, S表示大小为 D的随机向量, L F D是Levy飞行策略, F Y表示适应度函数。
r < 0.5 E < 0.5时,鹰采取渐进式快速俯冲的硬包围进行突袭,位置更新如下
X t + 1 = Y        F Y < F X t Z        F Z < F X t
Y = X r a b b i t t - E J X r a b b i t t - X a v e t
Z = Y + S × L F D
使用HHO算法优化XGBoost参数,得到扩展XGBoost(extended XGBoost, eXGBoost)模型,优化的参数及HHO算法参数分别如表10表11所示,选择均方根误差(Root Mean Squared Error, RMSE)作为算法评估指标及算法适应度函数。
表10 XGBoost优化参数

Table 10 Optimized parameters of XGBoost

参数 意义
max_depth 树的最大深度
n_estimators 决策树的弱学习器数量
subsample 每棵树随机取样的比例
colsample_bytree 构建弱学习器时随机采样的特征比例
colsample_bylevel 每个分层随机采样的特征比例
lambda XGBoost的正则化参数
alpha XGBoost的正则化参数
gamma XGBoost中决策树拆分导致loss减少的阈值
learning_rate 控制每个弱学习器的权重降低系数
min_child_weight 子节点中最小样本的权重之和
表11 HHO参数设置

Table 11 Parameter Settings of HHO

参数 数值
迭代次数 50
种群规模 50
搜索空间上限 1
搜索空间下限 0
随机生成一组参数值,作为搜索空间内的哈里斯鹰种群,每只鹰与XGBoost的一个参数绑定。由于鹰群的搜索空间存在上下限,鹰群的位置与XGBoost参数之间存在映射关系,整体流程如算法1所示。经过多轮迭代,获得优化后的模型参数,构建了鲁棒性的智能评估模型,可利用该模型对集群鲁棒性进行量化预测。

算法1 XGBoost参数优化算法

输入:种群规模 N和最大迭代次数 T

输出:eXGBoost模型

1:  Randomly generated X i = 1,2 , , N as initial Harris        hawk populations

2:  while stopping condition is not met do:

3:    Calculate the fitness values of hawks

4:  Set X r a b b i t as the location of rabbit (Location of                 optimal fitness)

5:   for each hawk( X i) do:

6:    Update the initial energy E 0 and jump strength J

7:    Update the E according to Eq. (17)

8:   if E 1 then:

9:    Update the location vector according to Eq.(16)

10:   end if

11:   if E < 1 then:

12:    if r 0.5 and E 0.5 then

13:     Update the location vector according to Eq.(18)

14:    else if r 0.5 and E < 0.5 then

15:     Update the location vector according to Eq.(19)

16:    else if r < 0.5 and E 0.5 then

17:     Update the location vector according to Eq.(20)

18:    else if r < 0.5 and  E < 0.5 then

19:     Update the location vector according to Eq.(23)

20:    end if

21:   end if

22:  end for

23: end while

24: Calculation of model parameters

25: return eXGBoost model

5.2 评估结果

依据构建的无人机集群鲁棒性指标集,重复多组实验并收集数据,共获得343组数据样本,部分数据样本如表12所示。图10显示了鲁棒性量化指标与指标变量的相关系数,可以看出,鲁棒性与聚类系数、平均节点度以及感知面积比值之间存在明显的正相关:当节点之间的聚类系数越高、节点的度越大、感知面积比值越大时,集群的鲁棒性越优,其中聚类系数对鲁棒性的影响最为显著;相反,鲁棒性指标与平均路径长度、故障节点比例之间则存在较强的负相关关系,平均路径长度的增加、故障节点比例的增加及节点的连接效率下降将导致集群鲁棒性下降。
表12 数据样例

Table 12 Data samples

指标 样例1 样例2 样例3 样例4
感知范围 5 5 7 5
通信范围 10 10 13 10
集群规模 100 120 90 120
集群拓扑 社团网络 规则网络 随机网络 随机网络
平均路径长度 2.61 6.93 5.31 6.39
平均节点度 4.66 3.16 4.31 2.93
聚类系数 0.53 0 0.47 0.35
故障模式 未故障 随机故障

策略A

节点故障

度最大

节点故障

故障节点比例 0 0.1 0.2 0.3
节点平均收益 2.308 2.44 2.377 5 2.23
感知面积比值 1 0.905 0.809 0.742
鲁棒性指标 0.657 0.495 0.58 0.524
图 10 鲁棒性量化指标与指标变量的相关系数

Fig.10 Correlation coefficients between robustness quantitative metric and indicators

本文比较了7种机器学习模型与提出的eXGBoost模型的实验结果,分析这些方法在无人机集群鲁棒性量化评估中的表现。所选的对比模型包括支持向量机(Support Vector Machines, SVM)37、多层感知机(Multi-Layer Perceptron, MLP)38、核岭回归(Kernel Ridge Regression)39、深度随机向量函数链网络(Deep Random Vector Functional Link network,DRVFL)40、以及XGBoost、LightGBM和CatBoost。支持向量机作为一种常见的机器学习算法,在各种机器学习任务中表现出优异的性能;多层感知器是评估任务应用较多的机器学习模型,由3个隐藏层构成,分别包含128、256和128个节点;核岭回归将岭回归与核分析相结合,与支持向量机类似;DRVFL是一种基于随机神经网络的深度学习框架;XGBoost、LightGBM和CatBoost均为常用的GBDT算法,具有高效的训练速度和良好的性能。将343组数据样本分为训练集和测试集,80%的样本用于训练,20%用作测试。考虑到实验过程存在一定的波动性,所以设置不同的误差容忍度,观察各模型的预测准确率,实验结果如表13所示,可以看出eXGBoost模型在各组实验性能更优,评估准确率更高。
表13 算法准确率对比

Table 13 Algorithm accuracy comparison

算法 准确率
误差容忍度0.04 误差容忍度0.06 误差容忍度0.08 误差容忍度0.10
eXGBoost 0.93 0.96 0.97 0.98
XGBoost 0.84 0.91 0.95 0.97
LightGBM 0.85 0.93 0.97 0.98
CatBoost 0.85 0.9 0.93 0.94
SVM 0.55 0.73 0.77 0.81
MLP 0.83 0.91 0.95 0.96
Kernel ridge regression 0.70 0.87 0.93 0.97
DRVFL 0.6 0.72 0.78 0.85
本文选择平均绝对误差(Mean Absolute Error, MAE)、均方误差(Mean Squared Error,MSE)、均方根误差(Root Mean Squared Error,RMSE)和 R 2作为比较不同模型的性能指标。令 y表示真实值, y ^表示预测值, n '表示样本数量。
MAE表示数据集中实际值与预测值之间绝对差异的平均值,其定义如下
M A E = 1 n ' i = 1 n ' y i - y ^ i
MSE表示数据集中实际值与预测值之间平方差的平均值。定义如下
M S E = 1 n ' i = 1 n ' y i - y ^ i 2
RMSE是MSE的平方根,定义如下
R M S E = 1 n ' i = 1 n ' y i - y ^ i 2
R 2是一个0~1的值, R 2越大,表示模型拟合得越好,如果为0,说明模型拟合效果很差;如果为1,说明模型无错误。 y ¯ i表示均值, R 2定义如下
R 2 = 1 - i y ^ i - y i 2 i y ¯ i - y i 2  
表14展示了不同模型在MAE、MSE、RMSE和 R 2等评估指标上的表现。由表14可知,提出的eXGBoost在所有指标上均优于其他模型,具有较小的MAE、MSE、RMSE和更大的 R 2值,表明模型预测的稳定性和可靠性更强,整体表现优异。
表14 算法性能比较

Table 14 Algorithm performance comparison

算法 MAE MSE RMSE R 2
eXGBoost 0.043 0.005 0.071 0.994
XGBoost 0.067 0.014 0.120 0.978
LightGBM 0.061 0.011 0.104 0.990
CatBoost 0.082 0.086 0.294 0.950
SVM 0.230 0.161 0.401 0.804
MLP 0.119 0.042 0.205 0.960
Kernel ridge regression 0.093 0.020 0.136 0.980
DRVFL 0.182 0.112 0.335 0.863

5.3 指标与鲁棒性关联关系分析

eXGBoost在集群评估方面表现出色,能够有效捕捉指标数据中的复杂关系并做出精准预测。为了给集群设计提供更加有效反馈,提高评估模型的可解释性,本文使用SHapley Additive exPlain (SHAP)41方法来分析各指标在模型预测中的重要性。SHAP被认为是增强模型可解释性的有力方法,建立在由Shapley提出的博弈论概念Shapley值之上42。SHAP方法计算每个特征对预测结果的贡献值,提供更细粒度的解释性,揭示每个特征在不同数据点下对模型输出的影响,并支持全局和局部解释。
从SHAP分析角度,相同指标在不同样本的SHAP值可能会有所不同,决策树样本的最终输出值也可以表示为各指标SHAP值的总和再加上基本值,该方法满足指标贡献值的加法性
f ^ x = ϕ 0 + i = 1 M ϕ i z ' i  
式中: f ^ x代表决策树中样本的预测值, z ' i { 0,1 },表示样本所在的决策路径中是否包含特征。对于某个样本,如果特征 k不在其决策路径中,则相应特征的 z ' i为0,否则为1。 ϕ i表示特征 i的SHAP值
ϕ i = S N i S ! M - S - 1 ! M ! · f x S i - f x S  
式中: N是训练集中所有特征的集合,其维度为 M S是从 N中提取的子集,其维度为 S f x S表示特征集 S根据树结构计算出的样本平均值。 f x S i表示在特征集 S的基础上增加特征 i,再根据树结构和叶节点的值计算样本的平均值。 S ! M - S - 1 !   / M !  是在相应的特征子集 S下,含有特征 i和不含特征 i的样本值之差的权重。
1) 指标重要性分析
计算各指标的SHAP值,并取其平均绝对值,得到全局指标相对重要性,如图11所示。可以看出,平均节点度、聚类系数和感知面积比值对集群鲁棒性产生较大影响。当集群的平均节点度较高时,节点之间的通信和协同更为频繁,从而增强了集群对突发情况的应对能力;聚类系数较高意味着集群内无人机之间有更强的协同和联系,感知面积比值较高则体现了集群的任务完成度较高。
图 11 指标重要性条形图

Fig.11 Bar chart of indicators importance

2) 指标与鲁棒性之间的映射机理
尽管图11反映了指标的相对重要性,但是无法展示指标对预测值的影响范围和对应SHAP值的分布情况。图12显示了各样本每个指标的SHAP值,纵轴位置取决于指标全局重要性。可以看出,图12图11结果一致。横轴位置取决于指标对应的SHAP值,颜色变化反映了指标值大小与SHAP值的关系,进一步明确指标变化对鲁棒性的影响。对于无人机集群来说,平均节点度对集群鲁棒性最为重要,且当平均节点度较大时,SHAP值大于0,对鲁棒性产生正向影响,聚类系数和感知面积比值也与之类似。平均路径长度随着值的增加,SHAP值反而减小。因此,增加平均节点度、增加聚类系数等能够提高集群整体鲁棒性。
图 12 指标重要性SHAP概要图

Fig.12 SHAP summary plot of indicators importance

为了区分集群的鲁棒性性能,设置鲁棒性阈值为 r = 0.55。当鲁棒性量化结果高于该阈值时,认为集群具有较好的鲁棒性;反之,集群鲁棒性较差。图13展示了各指标对集群鲁棒性性能的影响,可以看出,对于鲁棒性较差的集群,平均节点度的影响尤为显著。这是因为,平均节点度较小的集群在面对节点的突然失效时容易崩溃,不利于集群在多变的环境中稳定运行,进而导致任务执行效果低下。由图13(b)可知,对于鲁棒性较好的集群,感知面积比值对结果影响最大。因此,应设计合理的协同策略,提升集群面对节点失效的应对能力,提升任务完成度。
图 13 不同鲁棒性集群SHAP概要图

Fig.13 SHAP summary plot of swarm with different robustness

3) 对单个样本的解释
分析单个样本的力图可以得到模型预测值高低的机理,如图14所示。模型预测值为 f x = 0.61,表示当前样本的SHAP值的输出,基值为base value,即全体样本的平均值。对于该样本来说,平均节点度、聚类系数、平均路径长度、平均节点度、通信范围等指标产生正贡献,覆盖面积比值、故障节点比例等指标会产生负贡献。线段距离越长,表明指标对输出的影响越大。分析可知,平均节点度、聚类系数和感知面积比值对鲁棒性影响最大。
图 14 单个样本力图

Fig.14 SHAP force plot of individual sample

4) 对多个样本的解释
决策图是各样本SHAP值的表示,显示了模型如何做出决策,通过决策图可以了解指标是如何以不同的大小和方向推动模型的预测值发生变化。对多个样本进行决策图可视化,得到图15。决策图中间灰色垂直线标记了模型的基值,与力图中的基值一致;彩色线是每个样本的预测,表示每个指标如何推动样本预测值偏离基值,预测线反映了单一样本的每个指标如何影响最终的鲁棒性量化值。
图 15 多个样本决策图

Fig.15 SHAP decision plot of multiple samples

此外,不同指标对预测结果的影响因样本而异,表现为SHAP值的大小和方向差异,某些指标可能在一些样本中具有正向影响,而在另一些样本中表现出负向作用,这体现了指标对预测结果的动态影响。
5) 指标相关图
指标相关图表明一个或两个指标对模型预测结果的影响,说明指标之间的关系是线性、正负相关还是更复杂。图16反映了平均节点度和聚类系数对预测集群鲁棒性带来的影响。平均节点度与SHAP值的关系近似为线性关系,表明其对鲁棒性带来正向影响。平均节点度的增加引起聚类系数的增加,增大了节点的邻居数,邻居间连接的机会增大,平均节点度和聚类系数关系正相关。因此,增加平均节点度和聚类系数往往会增强集群鲁棒性。
图 16 平均节点度与聚类系数相关图

Fig.16 Correlation between average node degree and clustering coefficient

6 结 论

无人集群在任务执行过程中会面临各种突发状况,开展集群鲁棒性评估具有重要理论意义与应用价值。本文以无人机集群协同感知任务为例,利用鹰鸽演化博弈对集群进行建模,建立了集群协同演化框架,并从集群属性、环境属性和任务效果3个维度构建了无人机集群鲁棒性指标集,提出鲁棒性量化指标。随后,分析了不同干扰场景对集群鲁棒性的影响。最后,建立了鲁棒性智能评估方法,并构建了评估指标-评估结果关联关系分析方法,从不同视角分析指标对鲁棒性的作用机制。结果表明,本文提出的方法能够为无人集群的优化设计提供有效反馈,助力无人集群的持续发展。
[1]
沈博, 武文亮, 杨刚, 等. 基于群体OODA的无人集群系统智能评价模型及方法[J]. 航空学报202344(14): 328003.

SHEN B WU W L YANG G, et al. Evaluation models and methods for intelligence of unmanned swarm systems based on collective OODA loop[J]. Acta Aeronautica et Astronautica Sinica202344(14): 328003 (in Chinese).

[2]
WU W L ZHOU X S SHEN B. Comprehensive evaluation of the intelligence levels for unmanned swarms based on the collective OODA loop and group extension cloud model[J]. Connection Science202234(1): 630-651.

[3]
王龙, 陈芳, 陈星如. 博弈收益控制研究进展[J]. 中国科学: 信息科学202353(4): 623-646.

WANG L CHEN F CHEN X R. Payoff control in game theory[J]. Scientia Sinica (Informationis)202353(4): 623-646 (in Chinese).

[4]
禹明刚, 陈瑾, 何明, 等. 基于演化博弈的社团网络无人集群协同机制[J]. 中国科学: 技术科学202353(2): 221-242.

YU M G CHEN J HE M, et al. Cooperative evolution mechanism of multiclustered unmanned swarm on community networks[J]. Scientia Sinica (Technologica)202353(2): 221-242 (in Chinese).

[5]
WU Z H PAN L YU M G, et al. A game-based approach for designing a collaborative evolution mechanism for unmanned swarms on community networks[J]. Scientific Reports202212: 18892.

[6]
禹明刚, 何明, 张东戈, 等. 基于演化博弈的结构化无人集群协作控制方法[J]. 火力与指挥控制202146(10): 24-31, 38.

YU M G HE M ZHANG D G, et al. Approach to coordinated control of structured unmanned cluster based on evolutionary game[J]. Fire Control & Command Control202146(10): 24-31, 38 (in Chinese).

[7]
王龙, 黄锋. 多智能体博弈、学习与控制[J]. 自动化学报202349(3): 580-613.

WANG L HUANG F. An interdisciplinary survey of multi-agent games, learning, and control[J]. Acta Automatica Sinica202349(3): 580-613 (in Chinese).

[8]
SU Q LI A M WANG L, et al. Spatial reciprocity in the evolution of cooperation[J]. Proceedings Biological Sciences2019286(1900): 20190041.

[9]
DU J M WU B WANG L. Aspiration dynamics in structured population acts as if in a well-mixed one[J]. Scientific Reports20155: 8014.

[10]
JIANG L L PERC M SZOLNOKI A. If cooperation is likely punish mildly: Insights from economic experiments based on the snowdrift game[J]. PLoS One20138(5): e64677.

[11]
SUN Y Y ZHANG S L LIU M Q, et al. Multi-agent evaluation for energy management by practically scaling α-rank[J]. Frontiers of Information Technology & Electronic Engineering202425(7): 1003-1016.

[12]
OHTSUKI H HAUERT C LIEBERMAN E, et al. A simple rule for the evolution of cooperation on graphs and social networks[J]. Nature2006441(7092): 502-505.

[13]
SU Q MCAVOY A WANG L, et al. Evolutionary dynamics with game transitions[J]. Proceedings of the National Academy of Sciences2019116(51): 25398-25404.

[14]
FU F NOWAK M A HAUERT C. Invasion and expansion of cooperators in lattice populations: Prisoner’s dilemma vs. snowdrift games[J]. Journal of Theoretical Biology2010266(3): 358-366.

[15]
MACIEJEWSKI W FU F HAUERT C. Evolutionary game dynamics in populations with heterogenous structures[J]. PLoS Computational Biology201410(4): e1003567.

[16]
PEÑA J WU B ARRANZ J, et al. Evolutionary games of multiplayer cooperation on graphs[J]. PLoS Computational Biology201612(8): e1005059.

[17]
LEONARD N E LEVIN S A. Collective intelligence as a public good[J]. Collective Intelligence20221: 26339137221083293.

[18]
ALBERT R JEONG H BARABÁSI A L. Error and attack tolerance of complex networks[J]. Nature2000406(6794): 378-382.

[19]
IYER S KILLINGBACK T SUNDARAM B, et al. Attack robustness and centrality of complex networks[J]. PLoS One20138(4): e59613.

[20]
TIAN M DONG Z C WANG X P. Reinforcement learning approach for robustness analysis of complex networks with incomplete information[J]. Chaos, Solitons & Fractals, 2021144: 110643.

[21]
BULDYREV S V PARSHANI R PAUL G, et al. Catastrophic cascade of failures in interdependent networks[J]. Nature2010464(7291): 1025-1028.

[22]
BILAL K MANZANO M ERBAD A, et al. Robustness quantification of hierarchical complex networks under targeted failures[J]. Computers & Electrical Engineering201872: 112-124.

[23]
WANG X H ZHANG Y WANG L Z, et al. Robustness evaluation method for unmanned aerial vehicle swarms based on complex network theory[J]. Chinese Journal of Aeronautics202033(1): 352-364.

[24]
HAN T A. Emergent behaviours in multi-agent systems with Evolutionary Game Theory[J]. AI Communications202235(4): 327-337.

[25]
WANG L FU F CHEN X R. Mathematics of multi-agent learning systems at the interface of game theory and artificial intelligence[J]. Science China Information Sciences202467(6): 166201.

[26]
於志文, 孙卓, 程岳, 等. 智能无人机集群协同感知计算研究综述[J]. 航空学报202445(20): 630912.

YU Z W SUN Z CHENG Y, et al. A review of intelligent UAV swarm collaborative perception and computation[J]. Acta Aeronautica et Astronautica Sinica202445(20): 630912 (in Chinese).

[27]
TAYLOR P D JONKER L B. Evolutionary stable strategies and game dynamics[J]. Mathematical Biosciences197840(1-2): 145-156.

[28]
MARTIN N KARL S. Evolutionary dynamics of biological games[J]. Science2004303(5659): 793-799.

[29]
SZABÓ G TŐKE C. Evolutionary prisoner’s dilemma game on a square lattice[J]. Physical Review E199858(1): 69-73.

[30]
CHEN T Q GUESTRIN C. XGBoost: A scalable tree boosting system[C]∥Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM, 2016: 785-794.

[31]
KE G L MENG Q FINLEY T, et al. LightGBM: A highly efficient gradient boosting decision tree[J]. Advances in Neural Information Processing Systems2017: 3149-3157.

[32]
PROKHORENKOVA L GUSEV G VOROBEV A, et al. CatBoost: Unbiased boosting with categorical features[J]. Advances in Neural Information Processing Systems2018: 6639–6649.

[33]
SHWARTZ-ZIV R ARMON A. Tabular data: Deep learning is not all you need[J]. Information Fusion202281: 84-90.

[34]
MENG K T WU Q Q XU J, et al. UAV-enabled integrated sensing and communication: Opportunities and challenges[J]. IEEE Wireless Communications202331(2): 97-104.

[35]
SHEN B GU Q YANG G. Joint task offloading and UAVs deployment for UAV-assisted mobile edge computing[J]. Computer Networks2023234: 109943.

[36]
HEIDARI A A MIRJALILI S FARIS H, et al. Harris Hawks optimization: Algorithm and applications[J]. Future Generation Computer Systems201997: 849-872.

[37]
CORTES C VAPNIK V. Support-vector networks[J]. Machine Learning199520(3): 273-297.

[38]
RUMELHART D E HINTON G E WILLIAMS R J. Learning representations by back-propagating errors[J]. Nature1986323(6088): 533-536.

[39]
HE J R DING L X JIANG L, et al. Kernel ridge regression classification[C]∥2014 International Joint Conference on Neural Networks (IJCNN). Piscataway: IEEE Press, 2014: 2263-2267.

[40]
HU M H HERNG CHION J SUGANTHAN P N, et al. Ensemble deep random vector functional link neural network for regression[J]. IEEE Transactions on Systems, Man, and Cybernetics: Systems202253(5): 2604-2615.

[41]
LUNDBERG S M LEE S I. A unified approach to interpreting model predictions[J]. Advances in neural information processing systems2017: 4768–4777.

[42]
SUNDARARAJAN M NAJMI A. The many Shapley values for model explanation[C]∥International Conference on Machine Learning. Amsterdam: Elsevier, 2019.

文章导航

/