Electronics and Electrical Engineering and Control

UAV-UGV collaborative air-ground path planning method based on three-stage optimization

  • Shufang XU 1, 2 ,
  • Wenxuan FEI 1 ,
  • Heng LI 1 ,
  • Hongmin GAO , 1
Expand
  • 1. College of Computer Science and Software Engineering,Hohai University,Nanjing 211100,China
  • 2. Shaanxi Key Laboratory of Optical Remote Sensing and Intelligent Information Processing,Xi’an 710119,China

Received date: 2025-08-03

  Revised date: 2025-08-25

  Accepted date: 2025-08-29

  Online published: 2025-09-10

Supported by

The Open Research Fund of Shaanxi Key Laboratory of Optical Remote Sensing and Intelligent Information Processing(KF20230301)

Abstract

Unmanned Aerial Vehicle-Unmanned Ground Vehicle (UAV-UGV) air-ground collaborative systems are widely applied and garner significant attention across various domains. UAVs offer advantages in high speed and maneuverability but suffer from limited endurance, while UGVs, though possessing relatively constrained mobility, provide substantial ground payload capacity and can serve as mobile relay stations for UAVs. Path planning for such collaborative systems presents a complex and challenging problem, aiming to generate feasible paths for both UAVs and UGVs to cooperatively accomplish missions. This paper comprehensively considers practical constraints frequently encountered in real-world scenarios, including speed, energy consumption, power limitations, and obstacles, overcoming the limitation of traditional air-ground systems which often focus on a single perspective (either airborne or ground-based). We establish a task-oriented UAV-UGV air-ground collaborative system model and propose a three-stage-optimization collaborative path planning method. Specifically, we develop a Meta-learning Local-search Genetic Algorithm (MLGA), combining meta-learning strategies with local search, to solve the first-stage global path generation problem within the collaborative model. For the second-stage UGV obstacle avoidance, we introduce a temporal particle A* algorithm, integrating an improved particle filter algorithm with an optimized temporal A* algorithm. Finally, addressing the third stage, we formulate a time-constrained UAV charging scheduling solution based on the distinct speed, energy, and power characteristics of UAVs and UGVs. The effectiveness of the proposed three-stage planning method is rigorously validated through simulations using virtual scenario data and real-world experiments.

Cite this article

Shufang XU , Wenxuan FEI , Heng LI , Hongmin GAO . UAV-UGV collaborative air-ground path planning method based on three-stage optimization[J]. ACTA AERONAUTICAET ASTRONAUTICA SINICA, 2026 , 47(7) : 332649 -332649 . DOI: 10.7527/S1000-6893.2025.32649

无人机-无人车协同系统1-2由无人机、无人车和控制中心组成。无人机飞行速度快,并且灵活、机动性强,但续航能力差3-4。无人车虽然机动性相对有限,但负载能力强,可以作为无人机在地面上的中继站5-6。无人机和无人车的合作可以全面结合它们在速度、视野、能力和稳定性方面完成复杂任务的优势7-8。近年来,无人机-无人车协同系统广泛应用于军事和民用领域,如地形探测9、物流运输10、精准农业11、目标跟踪12、目标监测13、抢险救灾14、精确定位15、建筑检查16、目标检测17、未知区域探索18、导航19和信息收集20等。例如,在消防任务中,无人机用于探索该地区并确定火源,无人车用于将水源运输到火灾地点执行灭火任务21
路径规划是无人机-无人车协同系统执行现实世界复杂任务的一个常见但重要的问题22。路径规划问题通常被建模为带约束的优化问题,目的是找到无人机和无人车的最佳路径。随后设计启发式或元启发式算法来解决优化问题,如蚁群优化23、模拟退火24、禁忌搜索25、粒子群优化26、遗传算法27和贪婪算法28
针对无人机和无人车执行现实世界复杂任务的路径规划,已经有了一些研究。有些研究利用无人机的空中优势为无人车服务,Wang等29利用无人机的灵活性和视角优势,提出了一种用于越野环境下持续风险测绘的空地协同系统,帮助无人车在规划路径时避开陡坡、坑和沟渠等特殊障碍物;Ribeiro等30基于无人机与无人车的预算,并通过贪婪策略估计与可访问的货架相关的奖励,设计了仓库环境中用于库存检查的空地协作方法;Yang等31为解决城市场景中受实际路网约束、任务时间多变的多任务点访问问题,提出了一种基于蚁群算法的车载无人机群协同路径规划方法;Zhang等32提出了一种用于搜索和救援场景的地空协同框架,无人机负责提供空域视角的全局拓扑图并执行路径规划,无人车实现局部避障;Niu等33利用无人机的广阔视野辅助无人车进行路径规划。有些研究利用无人车的高负荷能力弥补无人机的不足。例如,Li等34提出了一种两级模因路径规划算法,帮助空地无人协同系统对城市违章建筑进行检测,其中无人车负责给无人机提供续航。除此之外,也有一些研究将两者综合考虑,例如Martinez-Rozas等35提出了一种基于最优快速探索随机树的路径规划方案,采用新颖的采样和转向技术来加快计算速度,该算法能够在三维环境中获得无人机和无人车的无碰撞路径;Singh等11提出了一种改进的贪婪随机自适应搜索程序算法来预测无人机和无人车从农田收集数据的有效路径。
在现有对无人机-无人车协同系统的研究中,大多数忽略了无人机和无人车的速度、能量和功率限制,以及地面障碍物对无人机飞行的影响36,过于理想化,且很多情况下任务主体只是无人机或者无人车中的一个,例如在文献[33]中,无人机除了给无人车提供视野,只起到了辅助的作用;而在文献[34]中,简单地将无人车仅视为无人机的能量补给单元,忽视了无人车的其他功能,而且没有考虑到地面障碍物对无人车的影响。将无人车视为一个独立而有多功能性的智能系统,可以更全面地利用其潜力,使其成为空地协同系统中的积极参与者。综上所述,本文综合考虑无人机和无人车各自的优缺点,提出了一种新型无人机-无人车协同系统的模型,用于执行复杂或危险环境下的巡视监测任务。系统中,无人机和无人车配备高清摄像头、热成像仪和气体传感器,实时监测目标区域的关键参数,识别异常情况。无人机负责覆盖难以接近的高空目标,执行视觉和传感器检查;无人车在地面执行类似任务,尤其在危险或受限环境中代替人类进入,并可搭载无人机并充电37。无线通信技术将现场数据实时传输给控制中心,帮助管理人员快速分析并制定应对方案。该协作系统能提高任务效率,降低人工成本和安全风险,保障作业安全和环境监测的可靠性。
本文的主要贡献总结如下:
1) 为充分发挥无人机与无人车的主体作用,本文构建了一种新型无人机-无人车协同系统的模型,用于执行巡视监测任务,其中无人机负责高空目标,无人车能够避开地面障碍物负责近地面目标并给无人机充电。
2) 对于异构无人系统而言,传统单一的方法很难满足复杂的任务需求,本文充分考虑了无人机和无人车的速度、能量、功率以及地形限制等约束条件,提出了一种三阶段规划方法。在第1阶段将巡视监测任务的全局路径生成问题建模为一个旅行商问题(Travelling Salesman Problem, TSP),且针对遗传算法收敛速度慢、局部搜索能力差等问题,提出了元学习局部搜索遗传算法(Meta-learning Local-search Genetic Algorithm, MLGA);第2阶段针对无人车在复杂环境中的避障问题,基于改进粒子滤波(Auxiliary Simulated-annealing Particle Filter, ASPF)算法和优化时间A*算法提出时域粒子A*(Temporal Particle A*, TPA*)算法;第3阶段基于无人机和无人车的速度、能量、功率提出无人机充电调度方法和动态协调机制,规划出无人机和无人车的协同路径。
3) 为增强真实性和有效性,构建了一个基于现实世界区域映射的环境,在虚拟数据集和真实数据集上进行了实验,验证三阶段规划方法的可行性,并展示了所提出的MLGA和ASPF算法的优秀性能。

1 建模与问题描述

1.1 环境模型

将任务场景建模为三维坐标系,任务场景大小设置为 L X × L Y × L Z,空间中任意点的坐标为 ( x , y , z ),其中 x { 1,2 , , L X }   y { 1,2 , , L Y } z { 1,2 , , L Z }。使用 G = { V , D , P a , P g }表示任务场景中的相关信息,场景中信息先验已知,其中 V = { v 1 , v 2 , , v n 1 }表示全部建筑物, v i V i = 1,2 , , n 1表示第 i个建筑, n 1表示建筑物的数目, D = { d 1 , d 2 , , d n 2 }表示绿化带等无人车无法通行的障碍区域, d j D   j = 1,2 , , n 2表示第 j个区域, n 2表示此类区域的数目, P a = { p a 1 , p a 2 , , p a m 1 }表示 m 1个无人机的目标点, p a k = ( x a k , y a k , z a k ) k = 1,2 , , m 1,表示无人机的第 k个目标点, P g = { p g 1 , p g 2 , , p g m 2 }表示 m 2个无人车的目标点, p g l = ( x g l , y g l , z g l )   l = 1,2 , , m 2表示无人车的第 l个目标点。为模拟真实场景,在构建建筑物时,采用了长方体与圆柱体两种常见的建筑类型,模拟场景的示意图如图1所示。
图 1 无人机-无人车协同路径规划仿真示意图

Fig.1 Schematic diagram of UAV and UGV collaborative path-planning simulation

无人机负责高空目标,无人车负责地面目标,同时无人车可以携带无人机并自动为无人机充电。路径规划的目标包括:
1) 任务时间尽可能短,以确保系统的效率。
2) 无人车在地面行驶时可以避开障碍物,以确保安全。
3) 无人车能够及时为无人机充电,以提高其续航能力。

1.2 无人机和无人车模型

在执行任务的过程中,无人机能够向各个方向自由飞行,包括上升和下降。无人机直线飞行速度为 v a 1,垂直升降速度为 v a 2
设无人机充满电时的能量为 E a m a x,最大飞行时间为 T a m a x。此外,沿用文献[34]的假设,认为无人机的充电模式遵循线性模型 f ( t ) = u f t,其中: u f为恒定控制参数; f ( t )为截止到 t时刻所获得的能量。设无人机从电量为零充满电所需时间为 T c m a x,即
T c m a x = E a m a x P c
式中: E a m a x为上文中提到的无人机最大能量; P c为无人机的充电功率,是一个恒定参数。
无人车的运动模型基于如图2网格地图38,即无人车只能在网格的中心移动。在每个时刻,无人机只能选择相邻网格的中心移动,如图2所示。
图 2 无人车运动模型示意图38

Fig.2 Schematic diagram of UGV motion model38

设无人车g在 t时刻的转向角为 u g ( t )   { 0 ° , 45 ° , 90 ° , 135 ° , 180 ° , 225 ° , 270 ° , 315 ° },则无人车g有如下运动方程:
x g ( t + 1 ) = x g ( t ) + v g × c o s u g ( t ) × π / 180 y g ( t + 1 ) = y g ( t ) + v g × s i n u g ( t ) × π / 180
式中: v g表示无人车的行驶速度,在此可以视为网格宽度; x g ( t ) , y g ( t )为无人车g在 t时刻的位置; x g ( t + 1 ) , y g ( t + 1 )为无人车g在 t + 1时刻的位置。
设无人车的能量为 E g m a x,作为无人机的能源供应单位,无人车的能量除满足自身任务需求之外,还要能够给无人机充电以支持其完成任务。

1.3 动态障碍物模型

动态障碍物指的是在地面附近运动的未知物体,例如其他车辆、行人等。为了描述这些障碍物的运动状态,本文采用基于线速度和转向角控制的运动模型进行建模,并引入高斯噪声以反映运动过程中的随机性和不确定性。具体而言,障碍物在 t时刻的状态向量定义为 s ( t ) = x d , y d , v d , θ d T,其中 x d , y d表示障碍物的当前位置, v d表示线速度, θ d表示航向角(与 x轴正方向的夹角)。障碍物在 t时刻的控制输入为 u ( t ) = Δ v d , Δ θ d T Δ v d Δ θ d分别表示单位时间内的速度增量和航向角增量。噪声服从均值为0、协方差矩阵为 Q的高斯分布,用于模拟环境干扰和运动不确定性。障碍物的状态更新方程如下:
s ( t + 1 ) = x d + v d c o s θ d y d + v d s i n θ d v d + Δ v d θ d + Δ θ d + w d
式中: w d为噪声项。该模型能够有效描述动态障碍物的运动行为,并为避障算法提供预测基础。

1.4 问题定义与三阶段分解

空地协同路径规划的核心目标是:在满足无人机能量约束、无人车避障约束以及系统时间效率的前提下,为无人机和无人车规划协同路径,共同完成巡视监测任务。为有效解决这一复杂问题,本文将其分解为3个顺序衔接、相互协同的阶段。

1.4.1 第1阶段:全局路径生成

由于无人机和无人车分别有各自的任务目标点,它们起点和终点相同,而中间的任务点都不相同,故本文将无人机和无人车全局路径生成问题建模为2个TSP,以最小化总任务时间为目标,此时系统完成任务的总时间为
T t o t a l = m a x { m i n T A , m i n T G }
式中: T A表示无人机在路径上的飞行时间; T G表示无人车在路径上的行驶时间。结合给定的环境信息 G = { V , D , P a , P g },无人机的直线飞行速度 v a 1,无人车的行驶速度 v g,对于无人机而言,其可以全方位自由飞行,由上一个目标点直接飞往下一个目标点,因此 T A可以表示为
T A = S 1 p 0 , p a 1 v a 1 + i = 1 m 1 - 1 S 1 p a i , p a i + 1 v a 1 + S 1 p a m 1 , p 0 v a 1
式中: p 0表示无人机和无人车的起始点; S 1 a , b表示ab两点之间的距离。对于无人车而言,存在建筑物和一些无法通行的区域,因此需要考虑实际路程的距离,用 S 2 a , b表示ab两点之间的实际道路长度,则无人车的行驶时间 T G
T G = S 2 p 0 , p g 1 v g + i = 1 m 2 - 1 S 2 p g i , p g i + 1 v g + S 2 p g m 2 , p 0 v g

1.4.2 第2阶段:动态避障路径规划

在第1阶段无人车全局路径的基础上,无人车要对环境中已知的静态障碍物如建筑物和绿化带等或动态障碍物如行人等进行有效的避让,以生成一条无碰撞的实际行驶路径。假设第1阶段得到的无人车路径为
P a t h G = x g ( 0 ) , y g ( 0 ) , z g ( 0 ) , x g ( 1 ) , y g ( 1 ) , z g ( 1 ) , , x g ( T G ) , y g ( T G ) , z g ( T G )
式中: x g ( t ) , y g ( t ) , z g ( t )表示无人车在 t时刻的位置,无人车执行任务所需总时间为 T G。实际上无人车紧贴地面行驶,因此实际中 z g t取值为0。要使无人车实现对静态障碍物的避让,要满足条件:
P a t h G ( V D ) =
即无人车全程与建筑物和无法行驶的区域无碰撞交互。在此基础上无人车还要对动态障碍物进行避让,动态障碍物在 t时刻的位置为 x d ( t ) , y d ( t ),假设无人车与障碍物的安全距离为 d,则无人车在每个时刻的可行位置必须满足:
x g ( t ) - x d ( t ) 2 + y g ( t ) - y d ( t ) 2 > d

1.4.3 第3阶段:无人机充电调度

由于无人机续航能力有限,无法一次性完成全局路径上的所有巡视任务,故需要对无人机进行充电调度。具体的调度过程是:无人机所剩能源不足时会中断任务飞往无人车进行充电,充电过程中无人车继续在自己的路径上进行巡视任务,无人机充满电后重新起飞返回任务中断点接着执行任务,重复上述过程直至所有任务完成。基于1.2节中无人机的能耗模型,可以把无人机充电调度问题转换为一个时间约束的问题。
假设拟定的无人机充电点的集合 C 1
C 1 = c 1 , c 2 , , c n , i = 1,2 , , n
式中: c i表示第 i个充电点的位置; n表示无人机需要充电的次数。无人机相邻2次充电的时间间隔与无人机充满电时间差值设为 Δ T Δ T则为无人机执行任务和飞往下一充电点的飞行时间,可以表示为
Δ T = Δ T 1 , Δ T 2 , , Δ T n - 1 , j = 1,2 , , n - 1
式中: Δ T j表示无人机在 c j j次充满电后执行任务并飞到 c j + 1进行第 j + 1次充电的飞行时间。在1.2节中提到无人机最大飞行时间为 T a m a x,则无人机需满足条件
m a x S 2 p 0 , c 1 v a , Δ T , S 2 c n , p 0 v a T a m a x
式中: S 2 p 0 , c 1 v a表示无人机从起点出发到第1个充电点的时间; S 2 c n , p 0 v a表示在最后一个充电点充完电后飞回到原点的时间。

2 三阶段路径规划方法

2.1 第1阶段

由于本文将第1阶段无人机无人车各自的全局路径生成建模为2个TSP,遗传算法常用于解决TSP,但其收敛速度较慢、局部搜索能力较弱,并且对参数设置高度敏感。因此,本文结合元学习和局部搜索策略,提出了MLGA以更为有效的解决TSP,从而生成无人机和无人车的全局路径。MLGA由全局搜索、局部搜索和元学习3个模块组成。全局搜索部分通过遗传算法进行实现,局部搜索则利用3-opt对部分个体进行操作,元学习模块根据种群表现动态调整参数。算法1展示了MLGA的框架,在此以无人机为例详细说明相关操作。

算法1 MLGA框架

1:

输入:种群规模: S p o p;最大迭代次数: G m a x;交叉概率: p c;变异概率: p m;进行局部搜索的个体比重: p l

2:

P o p= Initialization ( S p o p

3:

P o p p a r e n t←Selection( P o p

4:

P o p c h i l d←Genetic( P o p p a r e n t p c p m

5:

for i = 2 to G m a x do

6:

   P o p n e w 1←LocalSearch ( P o p c h i l d p l

7:

   P o p n e w 2←Selection( P o p c h i l d 1 - p l

8:

   P o p n e w 3←Genetic( P o p n e w 2 p c p m

9:

  if i 5 then:

10:

    Meta_adjust ( p c p m p l

11

  end if

12:

   P o p c h i l d←Update ( P o p n e w 1 P o p n e w 3

13:

end for

14:

输出:最优个体与最优值

2.1.1 全局搜索

算法1所示,本文使用遗传算法对无人机的TSP进行全局搜索。
P A = { P A 1 , P A 2 , P A 3 , , P A m }表示无人机的编码,本文从无人机目标点集合 P a中生成新的集合 P A。其中,基因值 P A i表示目标标签,基因位置 i表示到访顺序, m表示序列长度 m = m 1 + 1
算法1中Initialization(·)表示对无人机的种群初始化操作,对于每个个体,首先随机生成一个大小为 m的序列 P A,然后按式(5)的变形计算其适应度值 f i t n e s s A
f i t n e s s A = i = 1 m - 1 S 1 P A i , P A i + 1 v a 1 + S 1 P A m , P A 1 v a 1
算法1中Selection(·)表示对种群进行选择操作,本文采用典型的轮盘赌选择策略,通过选择保留对下一代具有高适合度的个体。
算法1中Genetic(·)表示对选择后的个体进行交叉和变异操作,来引导遗传算法探索。在解决TSP时,部分映射交叉操作由于其简单性和良好的亲本遗传性被广泛使用。交叉操作可能会导致解中出现重复的基因。在这种情况下,保留子代解中的交换基因,将其他片段中的重复基因映射到交换片段中冲突基因的对应基因上,图3是交换操作示意图。本文选择具有简单且随机的交换突变基因操作作为遗传算法中的变异操作,图4为变异操作示意图。
图 3 交叉操作示意图

Fig.3 Schematic diagram of crossover operation

图 4 变异操作示意图

Fig.4 Schematic diagram of mutation operation

2.1.2 局部搜索

MLGA针对传统遗传算法局部搜索能力较弱的问题,引入了k-opt局部搜索算法,以更好地提升解的质量、提高收敛速度。k-opt局部搜索算法在求解组合优化问题时表现出色,它通过局部改变解的结构来改进当前解,使得初步产生的个体能够得到进一步优化,从而跳出局部最优,进而找到更优的解。k表示局部搜索过程中移除的边的数量,本文采用的是3-opt策略。算法1中LocalSearch(·)表示局部搜索操作,图5展示了3-opt操作的示意图。
图 5 3-opt操作示意图

Fig.5 Schematic diagram of 3-opt operation

在MLGA中,仅对适应度较好的部分个体进行3-opt操作,是因为适应度好的个体已经在解空间的较优区域,进一步优化接近全局最优解的个体,有利于找到更精确的局部最优解。剩余个体重复全局搜索,继续在解空间中进行更广泛的探索,保持种群的多样性。

2.1.3 元学习模块

元学习是机器学习领域的一种技术,其核心思想是通过在多个任务上的学习,提取有助于加速新任务学习的知识。元学习在优化算法中的一个重要应用就是动态参数调整。通过引入元学习模块,可以根据算法在不同阶段的表现,动态调整这些超参数,使算法能够根据任务的变化进行自我优化。
引入局部搜索后,算法的表现依赖于几个关键的参数,包括交叉率 p c、变异率 p m、以及种群中参与3-opt的个体比重 p l,而最优的参数设置可能会随时间变化。本文针对传统遗传算法通常固定的参数设置可能会导致算法陷入局部最优解或收敛速度缓慢的问题,引入元学习模块。
算法1中的Meta_adjust(·)表示使用元学习模块对算法参数进行动态调整,元学习模块会记录每一代遗传算法的表现,包括最佳个体的适应度值、交叉率、变异率、 p l等信息,根据历史记录分析遗传算法当前的进展。在积累到五代数据后,计算最近五代的平均适应度值 f i t n e s s ( t ) ¯
f i t n e s s ( t ) ¯ = 1 5 i = 0 4 f i t n e s s ( t - i ) , t 5
式中: f i t n e s s ( t )表示第 t代适应度值,如果当代的适应度变差(即 f i t n e s s ( t ) ¯ < f i t n e s s ( t )),元学习模块会降低 p c p l,提高 p m,鼓励更多的全局搜索,增加种群的多样性,探索更广阔的解空间,即
p c n e w = p c × 0.9 p m n e w = p m × 1.1 p l n e w = p l - 0.05
相反,如果适应度变好(即 f i t n e s s ( t ) ¯ > f i t n e s s ( t )),元学习模块会降低 p m,增加 p c p l,使算法更集中于局部搜索,加快收敛至最优解,即
p c n e w = p c × 1.1 p m n e w = p m × 0.9 p l n e w = p l + 0.05
为了平衡算法的探索性和稳定性,3个参数设置约束为
s . t . p c ( 0.4,0.99 ) p m ( 0.000   1,0.1 ) p l ( 0.1,0.5 )
算法1中的Update(·)表示种群的迭代操作。第1代种群在经过全局优化阶段后得到第2代种群,第2代及后代种群中占比适应度较好的个体进行局部优化,剩余的个体继续全局优化,经过不同方式优化后的个体整合为新的子代。第5代及后代加入元学习模块动态调整参数,继续重复这样的迭代过程,就可以得到期望的无人机和无人车的路径规划解。
通过第1阶段的规划,可以得到无人机和无人车的路径,即
P a t h A = x a ( 0 ) , y a ( 0 ) , z a ( 0 ) , x a ( 1 ) , y a ( 1 ) , z a ( 1 ) , , x a ( T A ) , y a ( T A ) , z a ( T A )
P a t h G = x g ( 0 ) , y g ( 0 ) , z g ( 0 ) , x g ( 1 ) , y g ( 1 ) , z g ( 1 ) , , x g ( T G ) , y g ( T G ) , z g ( T G )
此处无人车路径表达式同式(7),式中: P a t h A表示无人机的路径; x a ( t ) , y a ( t ) , z a ( t )表示无人机在 t时刻的位置,无人机执行任务所需总时间为 T A,同样的 P a t h G表示无人车的路径; x g ( t ) , y g ( t ) , z g ( t )表示无人车在 t时刻的位置,无人车执行任务所需总时间为 T G

2.2 第2阶段

为了解决动态障碍环境下的无人车的避障问题,本文基于ASPF算法与优化时间扩展A*算法提出了TPA*,先通过ASPF算法对动态障碍物的位置进行预测,接着使用优化时间扩展A*算法生成当前时刻的最优路径。下面分别具体介绍ASPF算法和优化时间扩展A*算法。

2.2.1 ASPF算法

为提升粒子滤波在动态障碍物预测中的性能,本文针对标准粒子滤波的粒子退化与贫化问题,提出ASPF算法。该算法融合辅助粒子滤波39与模拟退火算法40,从以下3方面优化:
1) 添加随机扰动。借鉴模拟退火思想,在重采样后的粒子中引入高斯分布的扰动噪声,增强粒子多样性。扰动公式为
q ˜ = q + N 0 , σ k 2
式中: q ˜为扰动后的粒子位置; q为原始粒子位置; N 0 , σ k 2为高斯噪声, σ k 2 = α T k T k是温度参数, α是扰动系数。通过 T k控制扰动幅度 σ k 2,避免过度扰动影响估计精度。
2) 采用Metropolis采样。对扰动后的粒子,利用Metropoli准则筛选,既保留高权重粒子,又给低权重粒子一定保留概率,防止算法陷入局部最优。Metropolis准则表示为
p = e x p - E ' - E T k
式中: T k为温度参数; E E '分别表示原始粒子和扰动后粒子的能量,可以是粒子的负对数似然概率,即 E = - l n ( w ) E ' = - l n ( w ' ),其中 w w '分别是原始粒子和扰动后粒子的权重。若 E ' < E,则直接接受扰动;否则,若概率 p大于 [ 0,1 ]区间的随机数,则接受扰动,否则不接受扰动。
3) 退火温度控制。迭代过程中,温度参数按指数衰减方式更新,即
T k + 1 = β T k
式中: T k为第 k次迭代的温度; β为介于0和1之间的衰减系数。初期高温赋予粒子较大扰动,增强全局探索;后期低温减小扰动,确保粒子逐步稳定于最优解。

2.2.2 优化时间扩展A*算法

时间扩展A*算法在传统A*算法基础上引入时间维度,适应动态环境路径规划。但其生成路径常呈折线状,缺乏几何连续性,影响可行性和稳定性,增加能耗与控制难度。针对此,本文提出面向路径简化与光滑拟合的Catmull-Bézier混合方法优化该算法:
1) 路径简化:对时间扩展A*算法生成的离散路径进行简化处理,去除冗余点,保留几何转折关键节点。通过基于角度阈值的方式判断路径中的中间点是否与前后2点近似共线,若是则剔除该中间点,实现路径简化,降低后续处理复杂度。
2) 光滑拟合:设路径简化提取出的关键点为 K = K 0 , K 1 , , K n ',利用分段三次Bézier曲线连接提取出的关键点,实现一阶导数连续。具体地,对每一段路径 K i K i + 1构造三次Bézier曲线:
B ( t ) = k 1 ( 1 - t ) 3 + 3 k 2 t ( 1 - t ) 2 + 3 k 3 t 2 ( 1 - t ) + k 4 t 3
式中: k 1 = K i k 4 = K i + 1分别表示曲线段的起点和终点; k 2 k 3表示中间控制点,用于调节曲线形状。由于Catmull-Rom样条能够让插值曲线通过所有给定点并且局部构造切线控制曲率,因此使用Catmull-Rom样条生成上述4个控制点的局部切向量。对于中间关键点 K i,使用其前后点估计切线:
L i = K i + 1 - K i - 1 2
在此基础上,计算Bézier曲线的2个中间控制点:
k 2 = K i + L i 3
k 3 = K i + 1 - L i + 1 3
式中: k 2表示 K i的右控制点; k 3表示 K i + 1的左控制点。通过该方式,将Catmull-Rom样条的局部导数信息自然嵌入到Bézier曲线构造中,从而实现了在每段曲线间过渡处的导数连续性,确保整体路径在几何上具有良好的光滑性与一致性。
通过本文提出的TPA*算法,可以得到无人车进行避障后的路径 P a t h G '
P a t h G ' = x g 0 , y g 0 , z g 0 , x g 1 , y g 1 , z g 1 , , x g T G   ' , y g T G   ' , z g T G   '
此时无人车执行任务所需总时间为 T G   '

2.3 第3阶段

本文的协同系统集成了无人车,为无人机提供自主着陆和充电服务41,在第3阶段对无人机进行充电调度,将无人车的移动路径主动地作为无人机的移动充电网络,在无人车的规划路径上协同地选取充电点,并精确调度无人机在电量临界点前飞向这些充电点,确保无人机能及时获得能源补给。本文在该阶段还针对动态环境下无人车对动态障碍物进行避障造成的时间不确定性,提出动态协调机制,通过让无人机预留一定电量,确保任务的连续性。

2.3.1 充电调度

基于无人机的灵活性,在本模型中设计让无人机能源不足时暂时中断任务,主动向无人车靠近,在无人车上充电完成后,起飞前往任务中断前的下一任务点,能源不足时再次中断,充电完成后继续任务,如此循环往复直至完成全部任务。
无人车全程会按照2.2节中的TPA*算法给出的路线行驶,中间不做停留。这样就将能源供应的难题集中在了无人机的路径规划上。下面首先讲述充电点的选取方法。
1.2节提到无人机最大飞行时间为 T a m a x,无人机从电量为零到充满电所需时间,即最大充电时间为 T c m a x。设一个值 T 1(满足 T 1 < T a m a x),则在 T 1时间内,无人机有足够的电量支持飞行。类似的,设一个值 T 2(满足 T 2 > T c m a x),则在 T 2时间内,无人机一定能够充满电,在此,将 T 1视为无人机的续航时间,将 T 2视为无人机的充电时间。
P a t h G '中的 x g ( T 1 ) , y g ( T 1 ) , z g ( T 1 )当作无人机的第1个充电点,因为无人车在 T 1时刻会到达该充电点,所以无人机只要在 T 1时刻前到达 x g ( T 1 ) , y g ( T 1 ) , z g ( T 1 ),就必然有足够的能源支撑到无人车的到来。无人车到达后,无人机降落在无人车上进行充电。在无人机充电的过程中,无人车携带无人机继续向前行驶,经过 T 2时间,即在 ( T 1 + T 2 )时刻,无人机完成第1次充电,此时无人机与无人车同处在 x g ( T 1 + T 2 ) , y g ( T 1 + T 2 ) , z g ( T 1 + T 2 )点。无人机充满电后起飞前往下一目标点,此后经过 T 1时间,即在 ( 2 T 1 + T 2 )时刻,无人机再次找到无人车进行充电,经过 T 2时间,即在 ( 2 T 1 + 2 T 2 )时刻,无人机充满电再次起飞前往下一目标点。重复此过程,直到任务结束。
T 1 T 2为参量可以得到无人机的充电点和充满电后起飞点的集合 C 1 C 2,即
C 1 = x g T 1 , y g T 1 , z g T 1 , x g 2 T 1 + T 2 , y g 2 T 1 + T 2 , z g 2 T 1 + T 2 , , x g n T 1 + ( n - 1 ) T 2 , y g n T 1 + ( n - 1 ) T 2 , z g n T 1 + ( n - 1 ) T 2
C 2 = x g T 1 + T 2 , y g T 1 + T 2 , z g T 1 + T 2 , x g 2 T 1 + 2 T 2 , y g 2 T 1 + 2 T 2 , z g 2 T 1 + 2 T 2 , , x g n T 1 + n T 2 , y g n T 1 + n T 2 , z g n T 1 + n T 2
式中: n为无人机的充电次数。需要注意的是,如果 n 0 n,满足 n 0 T 1 + ( n 0 - 1 ) T 2 T G   '(或者 n 0 T 1 + n 0 T 2 T G   '),那么 n 1 [ n 0 , n ],都有
x g ( n 1 T 1 + ( n 1 - 1 ) T 2 ) , y g ( n 1 T 1 + ( n 1 - 1 ) T 2 ) , z g ( n 1 T 1 + ( n 1 - 1 ) T 2 ) = x g ( T G   ' ) , y g ( T G   ' ) , z g ( T G   ' )
x g ( n 1 T 1 + n 1 T 2 ) , y g ( n 1 T 1 + n 1 T 2 ) , z g ( n 1 T 1 + n 1 T 2 ) = x g ( T G   ' ) , y g ( T G   ' ) , z g ( T G   ' )
总的来说,从 P a t h G '中选取充电点,既保留了无人车的完整路径,减小了工作量,又降低了整体路径规划的难度,同时把问题集中在无人机上,接下来,考虑如何将这些充电点和起飞点融入到无人机的路径中。
因为加入了充电的过程,所以第1阶段中以最小化总任务时间为目标而得到的 P a t h A已经无法继续作为无人机的飞行路径,但 P a t h A中包含了无人机执行任务的最佳顺序。将 P a t h A中无人机的目标点按照顺序依次提出来,在前文将无人机的目标点定义为 P a = { p a 1 , p a 2 , , p a m 1 },为了更好地区分二者,在这里将新得到的集合定义为 P a   ' = { p a 1 ' , p a 2 ' , , p a m 1 ' },则无人机到达第 k个目标点 p a k '的时刻为 T A k
T A k = S 1 p 0 , p a 1 v a 1 , k = 1 S 1 p 0 , p a 1 v a 1 + i = 1 k - 1 S 1 p a i , p a i + 1 v a 1 , k 2
在第1个飞行周期中,逐渐增大 k值,依次计算 T A k,直到 T A k > T 1,证明无人机的电量不足以支撑到达 T A k时刻对应的 p a k '点,此时计算无人机从起点到 p a k - 1 '点实际所用时间 T A ( k - 1 ) ',计算方法由下面式子给出:
T A ( k - 1 ) ' = T A ( k - 1 ) + S 1 p a k - 1 ' , p g 1 ' v a 1 + z a ( k - 1 ) ' - z g T 1 v a 2
式中: T A ( k - 1 )表示无人机飞到第 k - 1个目标点时所耗费时间,这个值可由式(32)计算得出; S 1 p a k - 1 ' , p g 1 ' v a 1表示无人机从 p a k - 1 '~ p g 1 '的飞行时间; p a k - 1 '是第 k - 1个目标点; p g 1 ' x g T 1 , y g T 1 , z g T 1正上方与 p a k - 1 '高度相同的点,即 p g 1 ' = x g T 1 , y g T 1 , z a ( k - 1 ) ' z a ( k - 1 ) ' p a k - 1 ' z轴坐标; v a 1为无人机直线飞行的速度; z a ( k - 1 ) ' - z g T 1 v a 2表示无人机从空中垂直降落到无人车上的时间; v a 2表示无人机垂直升降的速度。整个过程表示无人机到达目标点 p a k - 1 '后,先平行飞到充电点的正上方,再垂直下降,这样在一定程度上避免了无人机和建筑物发生碰撞。
如果 T A ( k - 1 ) ' > T 1,表示即使从 p a k - 1 '点出发,剩余电量仍然不足以支撑无人机到达充电点,那么计算 T A ( k - 2 ) ' , T A ( k - 3 ) ' , 的值,直到出现 T A ( k - j 1 ) ' < T 1,取 T A ( k - j 1 ) '为任务中断点时刻,当无人机飞行 T A ( k - j 1 ) '时刻时到达中断点,中断任务,按上述路径飞往第1个充电点,在无人车到来后进行充电,直到充满电后起飞,前往下一任务点。令 r 1 - 1 = k - j 1,则此时中断点可以表示为 p a r 1 - 1 ',无人机的路径可以记录为
P a t h A ' = p 0 , p a 1 ' , p a 2 ' , , p a r 1 - 1 ' , x g ( T 1 ) , y g ( T 1 ) , z a ( r 1 - 1 ) ' , x g ( T 1 ) , y g ( T 1 ) , z g ( T 1 )
在后几次的充电过程中,与第1次充电不同的是,需要注意无人机充满电后起飞前往下一个目标点的路程。上一次任务中断点为 p a r 1 - 1 ',则此次任务起始点为 p a r 1 ',此次需要得到满足 T A k - T A r 1 > T 1的最小 k值,然后重新计算 T A ( k - 1 ) '的值,为与前文区分,此处记为 T A ( k - 1 ) ,新的计算方法由下式给出:
T A ( k - 1 ) = z a r 1 ' - z g ( T 1 + T 2 ) v a 2 + S 1 p g 2 ' , p a r 1 ' v a 1 + T A ( k - 1 ) - T A r 1 + S 1 p a k - 1 ' , p g 3 ' v a 1 + z a ( k - 1 ) ' - z g ( 2 T 1 + T 2 ) v a 2
式中: z a r 1 ' - z g ( T 1 + T 2 ) v a 2 + S 1 p g 2 ' , p a r 1 ' v a 1表示无人机从 x g ( T 1 + T 2 ) , y g ( T 1 + T 2 ) , z g ( T 1 + T 2 )点垂直上升,然后平行飞到 p a r 1 '的过程, z a r 1 ' p a r 1 '的纵坐标, p g 2 ' x g ( T 1 + T 2 ) , y g ( T 1 + T 2 ) , z g ( T 1 + T 2 )正上方与 p a r 1 '高度相同( z轴坐标相等)的点,即 p g 2 ' = x g ( T 1 + T 2 ) , y g ( T 1 + T 2 ) , z a r 1 ' T A ( k - 1 ) - T A r 1表示无人机空中飞行的时间,可结合式(32)计算, S 1 p a k - 1 ' , p g 3 ' v a 1 + z a ( k - 1 ) ' - z g ( 2 T 1 + T 2 ) v a 2表示无人机平行飞到充电点的正上方 p g 3 ' = x g ( 2 T 1 + T 2 ) , y g ( 2 T 1 + T 2 ) , z a ( k - 1 ) '处,再垂直下降所用的时间, z a ( k - 1 ) '为点 p a r 2 - 1 '的纵坐标。依次减小 k的值,直到出现 T A ( k - j 2 ) < T 1,取 T A ( k - j 2 ) 时刻对应的点为任务中断点,当无人机到达点 T A ( k - j 2 ) 时,中断任务,按上述路径飞往第2个充电点,在无人车到来后进行充电,直到充满电后起飞。令 r 2 - 1 = k - j 2,则此时中断点可以表示为 p a r 2 - 1 ',无人机的路径可以更新为
P a t h A ' = p 0 , p a 1 ' , p a 2 ' , , p a r 1 - 1 ' , x g ( T 1 ) , y g ( T 1 ) , z a ( r 1 - 1 ) ' , x g ( T 1 ) , y g ( T 1 ) , z g ( T 1 ) , x g ( T 1 + T 2 ) , y g ( T 1 + T 2 ) , z g ( T 1 + T 2 ) , x g ( T 1 + T 2 ) , y g ( T 1 + T 2 ) , z a r 1 ' , p a r 1 ' , p a r 1 + 1 ' , , p a r 2 - 1 ' , x g ( 2 T 1 + T 2 ) , y g ( 2 T 1 + T 2 ) , z a ( r 2 - 1 ) ' , x g ( 2 T 1 + T 2 ) , y g ( 2 T 1 + T 2 ) , z g ( 2 T 1 + T 2 )
假设在第 n次充电后,无人机同时满足式(36)中的2个条件:
T A m 1 - T A r n < T 1 z a r n ' - z g ( n T 1 + n T 2 ) v a 2 + S 1 p g n ' , p a r n ' v a 1 +          T A m 1 - T A r n + S 1 p a r m 1 ' , p 0 v a 1 < T 1
式中: T A m 1 - T A r n表示无人机从 p a r n '飞到 p a r m 1 '的时间; S 1 p a r m 1 ' , p 0 v a 1表示无人机从最后一个目标点 p a r m 1 '飞回起点 p 0的时间; z a r n ' - z g ( n T 1 + n T 2 ) v a 2 + S 1 p g n ' , p a r n ' v a 1表示第 n次充电后无人机垂直起飞后再平行移动到 p a r n '的时间,这一过程表示无人机的续航时间大于最后一段行程的飞行时间,此时无人机不再需要充电,即无人机的充电次数为 n次,按照上述流程,得到无人机最终路径为
P a t h A ' = p 0 , p a 1 ' , p a 2 ' , , p a r 1 - 1 ' , x g ( T 1 ) , y g ( T 1 ) , z a ( r 1 - 1 ) ' , x g ( T 1 ) , y g ( T 1 ) , z g ( T 1 ) , x g ( T 1 + T 2 ) , y g ( T 1 + T 2 ) , z g ( T 1 + T 2 ) , x g ( T 1 + T 2 ) , y g ( T 1 + T 2 ) , z a r 1 ' , p a r 1 ' , p a r 1 + 1 ' , , p a r 2 - 1 ' , x g ( 2 T 1 + T 2 ) , y g ( 2 T 1 + T 2 ) , z a ( r 2 - 1 ) ' , x g ( 2 T 1 + T 2 ) , y g ( 2 T 1 + T 2 ) , z g ( 2 T 1 + T 2 ) , x g ( 2 T 1 + 2 T 2 ) , y g ( 2 T 1 + 2 T 2 ) , z g ( 2 T 1 + 2 T 2 ) , x g ( 2 T 1 + 2 T 2 ) , y g ( 2 T 1 + 2 T 2 ) , z a r 2 ' , p a r 2 ' , p a r 2 + 1 ' , , p a r n - 1 ' , x g ( n T 1 + ( n - 1 ) T 2 ) , y g ( n T 1 + ( n - 1 ) T 2 ) , z a ( r n - 1 ) ' , x g ( n T 1 + n T 2 ) , y g ( n T 1 + n T 2 ) , z g ( n T 1 + n T 2 ) , x g ( n T 1 + n T 2 ) , y g ( n T 1 + n T 2 ) , z a r n ' , p a r n ' , p a r n + 1 ' , , p a m 1 ' , p 0

2.3.2 动态协调机制

当环境中具有动态障碍物出现时,无人车进行避障可能会导致无人车必须偏离原来规划路径,调整后的路径可能比原路径耗时更长。针对此问题,本文设计了动态协调机制,让无人机预留一定电量确保在局部路径调整后无人机仍有足够的电量抵达充电点,或在充电点等待无人车提供能源补给。
图6所示,时间轴展示了在不同时间点,无人机和无人车的行为及相应的变化。图中的横轴代表时间,虚线隔开的区域表示无人机的一个飞行周期或者协同系统的一个充电周期。假设在第2个飞行周期,任务环境中出现了动态障碍物,对协同系统产生了干扰,此时无人车必须进行避障,这可能会导致无人车消耗更多时间,而无人机会先一步到达充电点,无人机要在充电点多等待一段时间 τ。结合上节中提出的电量预留设计,协同系统能够支持一定的等待时间,以确保任务的连续性。具体来说,最长的等待时间由无人机的实际最大飞行时间 T a m a x与假设最大飞行时间 T 1之间的差值决定,即等待时间 τ应满足条件 τ < T a m a x - T 1。只要这一条件得到满足,无人机便能够继续执行后续任务,而不会因电量不足而中断。
图 6 协同系统路径规划时间轴

Fig.6 Timeline of path-planning in cooperative systems

第3阶段提出的充电调度方法和动态协调机制,帮助无人机最大限度地减少了寻找充电点或等待而产生的无效飞行和停泊时间,保障了协同系统在巡视任务中的高效性和连续性。

3 仿真实验与分析

3.1 仿真条件与实验参数

无人系统参数设置如表1所示,仿真实验的无人机参数参照大疆Phantom 4 Pro,无人车参数参照Autolabor。仿真中使用的硬件配置为12th Gen Intel Core i7 2.30 GHz处理器和16 GB内存,软件版本为Python 3.9.13。
表1 协作系统参数设置

Table 1 Parameter setting of cooperative system

系统 参数 数值
无人机 v a 1/(km·h-1 40
v a 2/(m·s-1 4
T a m a x/h 0.5
T 1/h 0.4
无人车 v g/(km·h-1 15(空车)
7.5(载无人机)
T 2/h 0.8

3.2 TSP算法对比

在这一部分中,实验对比了多种算法在路径规划任务中的表现,算法参数如表2所示,其中MLGA全局搜索模块与遗传算法使用相同的参数,蚁群算法和Q-Learning算法相关参数单独列出。
表2 求解TSP各个算法的参数设置

Table 2 Setting of parameters of various algorithms solving TSP

参数 意义 数值
G m a x 迭代次数 200
S p o p 种群规模 100
p c 交叉概率 0.9
p m 变异概率 0.05
p l 局部搜索个体比重 0.3
N m a x 蚁群迭代次数 200
N a n t s 蚂蚁数量 30
α 信息素因子 1
β 启发函数因子 2
ρ 信息素挥发因子 0.5
Q 信息素常量 100
l 学习率 0.5
N i t e r 训练轮次 10 000
具体实验中以无人机为例验证算法的优越性,本文在 400 × 400的地图中随机生成指定数量的目标点,使用五种算法对这些目标点求解TSP路径和路径长度,所有结果取30次独立重复试验的平均值。表3汇总了不同算法在目标点N T=20,30,40个上平均路径长度的实验结果。结果表明,遗传算法在给定的迭代次数内难以收敛到良好的解;贪婪算法容易陷入局部最优解;蚁群算法虽然在目标数量较少时取得了不错的解,但随着目标数量的增多,渐渐落后于MLGA算法;Q-Learning算法由于状态-动作空间爆炸也难以取得较优解。相比之下,MLGA在遗传算法的基础上引入了局部优化策略,通过元学习模块动态调节遗传参数,在全局探索与局部优化间形成协同机制,从而在给定迭代次数内稳定收敛到更优解。
表3 5种算法在实验中的平均路径长度结果

Table 3 Results of average path length of five algorithms in experiments

算法 平均路径长度/km
N T=20 N T=30 N T=40
MLGA 143.59 190.86 206.03
遗传算法 153.45 202.07 290.34
蚁群算法 143.64 193.31 216.22
贪婪算法 165.94 211.86 222.16
Q-Learning 146.96 198.67 211.52
图7展示了5种算法中在3组目标点集上规划的最短路径图。从图中可以明显看出,MLGA规划的路径在视觉上也表现出更合理的访问顺序和更少的冗余折返,这进一步验证了MLGA在无人机-无人车协作系统路径规划中的优越性。
图 7 5种算法规划的路径

Fig.7 Path-planning results of five algorithms

3.3 粒子滤波算法对比

本节实验对比分析了4种粒子滤波算法在目标预测方面的性能表现,包括标准粒子滤波算法(Particle Filter, PF)、辅助粒子滤波算法(Auxiliary Particle Filter, APF)、模拟退火粒子滤波算法(Simulated-annealing Particle Filter, SPF),以及ASPF算法。实验采用时延到达测量方法进行目标的测距与定位,该方法通过计算信号从目标发射到接收器接收所需的时间,从而推算出目标与接收器之间的距离,算法参数如表4所示。
表4 4种粒子滤波算法中的参数设置

Table 4 Setting of parameters of four PF algorithms

参数 意义 数值
T 0/℃ 初始温度 1
c 扰动系数 0.6
α 衰减系数 0.95
G P F 迭代次数 100
G S A 迭代次数 100
实验设计在二维平面上进行轨迹预测,用于评估不同粒子滤波算法的性能与适应能力。4种算法在相同的初始条件和参数配置下进行实验。具体地,设定粒子数N分别为100、200、500、1 000,对所有算法进行仿真测试,记录其在不同粒子数下的平均距离误差,距离误差指预测位置与真实位置的欧氏距离,平均距离误差则是所有时刻距离误差的均值。
实验结果如表5所示,由表5中数据可以看出,ASPF相较于其他算法在预测精度上有明显提升,尤其在粒子数较低(如100或200)时,这种提升更为显著。
表5 二维平面中不同粒子数对应的平均距离误差比较

Table 5 Comparison of mean distance errors under different particle counts in 2D space

算法 平均距离误差
N = 100 N = 200 N = 500 N = 1   000
PF 1.693 1 1.192 1 0.761 9 0.541 8
APF 1.147 3 0.864 1 0.662 4 0.509 3
SPF 0.940 1 0.721 0 0.570 9 0.518 9
ASPF 0.786 7 0.613 7 0.555 7 0.502 4
为了更直观地展现ASPF在预测精度方面的优势,图8进一步展示了4种算法4种粒子数的预测轨迹与真实轨迹对比图,以及把不同时刻的距离误差随时间变化曲线,从空间轨迹和距离误差2个维度,直观展示各算法的性能差异。从距离误差随时间变化的曲线来看,ASPF在整个实验过程中表现出更低的误差波动与更快的收敛速度。其误差曲线整体低于其他3种算法,特别是在目标轨迹发生剧烈变化如大角度转弯时,ASPF能够更快速响应并调整估计结果,体现出良好的动态适应能力。
图 8 二维空间中不同粒子数条件下各算法的预测轨迹与误差曲线

Fig.8 Predicted trajectories and error curves of algorithms under different particle counts in 2D space

3.4 协同系统的仿真实验

无人机-无人车协同系统的实验基于虚拟数据集和真实数据集,本部分从2D和3D视角分别展示了2组数据的实验结果,算法参数如表6所示。
表6 仿真实验中的参数设置

Table 6 Setting of parameters in simulation experiment

参数 意义 数值
d/m 安全距离 10
Δ t/s 时间步长 0.4
T p/s 预测时间窗 3
θ t h/(°) 角度阈值 5

3.4.1 虚拟数据集的实验结果

在这一部分的实验中,虚构了一个任务场景,用于验证三阶段规划方法的可行性。虚拟数据集的仿真结果如图9图10所示。2幅图的 x轴和 y轴1个单位长度表示80 m,地图范围为 100 × 100的正方形,无人机的飞行高度为120 m,图10 z轴呈现内容仅作示意。图9中淡蓝色矩形和圆形表示建筑物,橙色的点表示无人机和无人车的起点,坐标为 ( 5,5 );在无人机路径中,黑色圆点表示无人机目标点,坐标分别为 ( 20,20 ) ( 40,20 ) ( 50,40 ) ( 70,40 ) ( 60,10 ) ( 90,20 ) ( 90,50 ) ( 90,80 ) ( 70,80 ) ( 50,80 ) ( 20,80 ) ( 30,60 )   ( 10,50 ),红色线段表示无人机路径;在无人车路径中,黑色方点表示无人车目标点,坐标分别为 ( 25,30 ) ( 35,10 ) ( 55,25 ) ( 70,20 ) ( 90,35 ) ( 90,65 ) ( 75,65 ) ( 60,90 ) ( 35,80 ) ( 10,70 ),蓝色线段表示无人车路径;在协同路径中,▼/▲表示无人机降落或者起飞的点,紫色加粗线段表示无人车在给无人机充电的同时携带无人机按原路线执行任务。协同路径图中展示了协同系统工作的完整流程。首先,无人机和无人车从起点出发,红色线表示无人机的飞行路线,蓝色线表示无人车的行驶路线。在任务执行过程中,无人机能量不足时,不再前往下一个目标点,而是去寻找无人车进行充电(▼),充电期间,无人车按原规划路线行驶(紫色路线),当无人机能量补足后从无人车上起飞(▲)前往下一个目标点,直到巡视完所有目标点。图10在三维空间中展示了这一过程。
图 9 虚拟数据集2D实验路径

Fig.9 2D experimental path of virtual dataset

图 10 虚拟数据集3D实验路径

Fig.10 3D experimental path of virtual dataset

3.4.2 真实数据集实验结果

在这一部分的实验中,基于真实的地理信息搭建了一个任务场景,用于验证三阶段规划方法的可行性。选定的真实场景为作者所在的南京市江宁区河海大学校园,经度118.759 463°N、纬度32.055 548°E(数据源于Bigemap)。校园平面布局如图11所示,仿真实验结果如图12图13所示,图中路线和点的意义与虚拟数据集的实验基本一致,仿真结果展示了无人机-无人车协同系统的工作。其中建模后的二维地图如图12(a)所示,其中灰色表示建筑物,白色表示主干道路,浅绿色表示足球场,砖红色表示跑道和其他球场,浅蓝色表示湖,深绿色表示绿化带。相应三维地图如图13(a)所示。在仿真实验中,为了呈现在真实校园地图上无人机与无人车的协同效果,校园尺寸被放大15倍, x轴和 y轴1个单位长度表示30 m,地图范围为 510 × 420的长方形,无人机的飞行高度为120 m,图13 z轴呈现内容也仅作示意。无人机无人车起点为校园南门,坐标为 ( 230,33 ),校园主干道路将建筑物分为若干个建筑群,将每个建筑群上空的中心视为无人机的任务点,坐标分别为 ( 323,110 ) ( 230,163 ) ( 230,235 ) ( 468,218 ) ( 468,290 ) ( 380,368 ) ( 290,360 ) ( 160,365 ) ( 80,330 ) ( 50,238 ) ( 50,150 ) ( 50,65 ) ( 143,110 ),主干道路的交叉点视为无人车的任务点,坐标分别为 ( 270,130 ) ( 320,190 ) ( 375,150 ) ( 440,330 ) ( 320,330 ) ( 220,390 ) ( 140,330 ) ( 140,280 ) ( 90,280 ) ( 90,190 ) ( 140,190 ) ( 190,130 )
图 11 校园平面图

Fig.11 Actual campus plane map

图 12 真实数据集2D实验路径

Fig.12 2D experimental path of real dataset

图 13 真实数据集3D实验路径

Fig.13 3D experimental path of real dataset

具体而言,无人机和无人车从起点(校园南门)出发,在任务执行过程中,当无人机电量不足时,会寻求无人车进行充电,期间无人车按照既定路线行驶。充电后,无人机重新起飞并继续执行任务,最终完成对所有目标点的巡视。

3.4.3 鲁棒性实验结果

在这一部分的实验中,基于3.4.2节中的真实数据集,通过在无人车的必经之路上构建动态障碍物来模拟现实环境下的复杂情况。如图14所示,图中灰色线段表示动态障碍物的观测轨迹,灰色虚线段表示使用ASPF算法预测的轨迹,虚线边界的黄色圆形表示预测动态障碍物会阻挡无人车的位置,其它线段意义与3.4.2节中一致。仿真结果展示了无人机-无人车协同系统能够在具有动态障碍物的复杂环境中完成工作。具体而言,当系统观测到环境中有动态障碍物在运动,系统便会使用TPA*算法对动态障碍物的轨迹进行预测并更新最优路径。由于有动态协调机制,当无人车执行任务时发生避障,无人机只需在充电点多等待一会无人车的到达即可。
图 14 真实数据集鲁棒性2D实验路径

Fig.14 2D experimental path for robustness of real dataset

从仿真结果中可以看出,无人机-无人车协同系统能够高效稳定地运转。无人机和无人车从起始点出发后,能够迅速无遗漏地覆盖所有目标点,充分发挥了各自的优势,并展现了良好的协作能力。无人机在电量耗尽之前能及时精准地找到无人车进行充电,有效地提升了无人机的续航能力,避免了因电力不足而导致的任务中断,确保了任务的连续性。无人车在行驶过程中也表现出了良好的避障能力,能够灵活地规避建筑区和其他障碍,确保了任务安全地进行。最终无人机和无人车都顺利返回到原点结束任务。
无论是在虚拟环境还是现实复杂场景中,无人机-无人车协同系统都顺利地完成了任务,这表明所提出的三阶段规划方法在不同环境中均表现出色,进一步验证了其可行性与普适性。

4 结 论

本文构建了一种用于复杂或危险环境中巡视监测任务的无人机-无人车协同系统的模型,并提出了一种三阶段规划方法完成无人系统的路径规划。在第1阶段提出了一种结合元学习和局部搜索机制的改进遗传算法,以生成无人机和无人车的全局路径,保障无人系统的高效性;第2阶段基于ASPF算法和优化时间扩展A*算法提出TPA*算法,保证无人车能够完成在复杂环境中的避障行为;第3阶段设计了协同系统中无人机的充电调度方法和动态协调机制,确保任务的连续性。
本文将提出的MLGA和ASPF算法与其他经典算法进行了对比,验证了它们的优越性能,同时在虚拟环境、基于现实环境搭建的场景以及动态复杂环境中进行了仿真,结果表明所提出的三阶段规划方法在不同环境中均表现出色,进一步验证了其可行性和广泛适用性。这些良好的实验成果增强了对该方法未来应用潜力的信心,在后续的工作中,将继续研究高效的动态避障算法以及无人机-无人车协同过程中的更复杂的调度协同问题,以进一步提升系统的智能化水平和协同效率。
[1]
LI J Q DENG G Q LUO C W, et al. A hybrid path planning method in unmanned air/ground vehicle (UAV/UGV) cooperative systems[J]. IEEE Transactions on Vehicular Technology201665(12): 9585-9596.

[2]
GROCHOLSKY B KELLER J KUMAR V, et al. Cooperative air and ground surveillance[J]. IEEE Robotics & Automation Magazine200613(3): 16-25.

[3]
刘雷, 刘大卫, 王晓光, 等. 无人机集群与反无人机集群发展现状及展望[J]. 航空学报2022(S1): 726908.

LIU L LIU D W WANG X G, et al. Development status and outlook of UAV clusters and anti-UAV clusters[J]. Acta Aeronautica et Astronautica Sinica2022(S1): 726908 (in Chinese).

[4]
务益杰. 新型轻量化动力系统在无人机中的设计与应用[J]. 中国军转民2025(10): 55-56.

WU Y J. Design and application of new lightweight power system in UAV[J]. Defence Industry Conversion in China2025(10): 55-56 (in Chinese).

[5]
WANG T HUANG P F DONG G Q. Modeling and path planning for persistent surveillance by unmanned ground vehicle[J]. IEEE Transactions on Automation Science and Engineering202118(4): 1615-1625.

[6]
FU X W DENG C GUERRIERI A. Low-AoI data collection in integrated UAV-UGV-assisted IoT systems based on deep reinforcement learning[J]. Computer Networks2025259: 111044.

[7]
ZHANG J M YUE X K ZHANG H F, et al. Optimal unmanned ground vehicle: Unmanned aerial vehicle formation-maintenance control for air-ground cooperation[J]. Applied Sciences202212(7): 3598.

[8]
CHEN Y CHEN M Q CHEN Z H, et al. Delivery path planning of heterogeneous robot system under road network constraints[J]. Computers and Electrical Engineering202192: 107197.

[9]
DINELLI C RACETTE J ESCARCEGA M, et al. Configurations and applications of multi-agent hybrid drone/unmanned ground vehicle for underground environments: A review[J]. Drones20237(2): 136.

[10]
FAGUNDES-JÚNIOR L A BARCELOS C O SILVATTI A P, et al. UAV-UGV formation for delivery missions: A practical case study[J]. Drones20259(1): 48.

[11]
SINGH H BIKEN SINGH M PRATIK H, et al. UAV and UGV assisted path planning for sensor data collection in precision agriculture[C]∥2023 11th International Symposium on Electronic Systems Devices and Computing (ESDC). Piscataway: IEEE Press, 2023: 1-6.

[12]
YU H L MEIER K ARGYLE M, et al. Cooperative path planning for target tracking in urban environments using unmanned air and ground vehicles[J]. IEEE/ASME Transactions on Mechatronics201520(2): 541-552.

[13]
LI Z GUO Y L WANG G, et al. Informative trajectory planning for air-ground cooperative monitoring of spatiotemporal fields[J]. IEEE Transactions on Automation Science and Engineering202522: 2627-2638.

[14]
ZHOU Y JIN Z Q SHI H G, et al. Enhanced emergency communication services for post-disaster rescue: multi-IRS assisted air-ground integrated data collection[J]. IEEE Transactions on Network Science and Engineering202411(5): 4651-4664.

[15]
SIVANERI V O GROSS J N. Flight-testing of a cooperative UGV-to-UAV strategy for improved positioning in challenging GNSS environments[J]. Aerospace Science and Technology201882: 575-582.

[16]
HU D F GAN V J L WANG T, et al. Multi-agent robotic system (MARS) for UAV-UGV path planning and automatic sensory data collection in cluttered environments[J]. Building and Environment2022221: 109349.

[17]
MINAEIAN S LIU J SON Y J. Vision-based target detection and localization via a team of cooperative UAV and UGVs[J]. IEEE Transactions on Systems, Man, and Cybernetics: Systems201646(7): 1005-1016.

[18]
ZHENG L X WEI M X MEI R D, et al. AAGE: Air-assisted ground robotic autonomous exploration in large-scale unknown environments[J]. IEEE Transactions on Robotics202541: 1918-1937.

[19]
SIVANERI V O GROSS J N. UGV-to-UAV cooperative ranging for robust navigation in GNSS-challenged environments[J]. Aerospace Science and Technology201771: 245-255.

[20]
GOHATRE U B PATIL V P WADEKAR S Y. Effective information gathering in a three-dimensional setting through the unmanned aerial vehicles and wireless sensor networks[C]∥2023 1st DMIHER International Conference on Artificial Intelligence in Education and Industry 4.0 (IDICAIEI). Piscataway: IEEE Press, 2024: 1-6.

[21]
STAMPA M JAHN U FRUHNER D, et al. Scenario and system concept for a firefighting UAV-UGV team[C]∥2022 Sixth IEEE International Conference on Robotic Computing (IRC). Piscataway: IEEE Press, 2023: 253-256.

[22]
TIAN L CHEN Y WU H Y, et al. Air-ground cooperative path planning for doorstep pickup considering multiple uncertainty[J]. IEEE Sensors Journal202525(13): 25938-25947.

[23]
ZHENG J Y SUN X Y JI Y F, et al. Research on UAV path planning based on improved ACO algorithm[C]∥2023 IEEE 11th Joint International Information Technology and Artificial Intelligence Conference (ITAIC). Piscataway: IEEE Press, 2024: 762-770.

[24]
CAI J H WU J T PENG Z. Research on power equipment condition monitoring based on simulated annealing algorithm and convolutional neural network[C]∥2024 IEEE 4th International Conference on Electronic Technology, Communication and Information (ICETCI). Piscataway: IEEE Press, 2024: 1371-1374.

[25]
KHALID A N RAO BAKI N M PHANI VARMA T S, et al. Tabu search algorithm: Optimizing the search runtime[C]∥2024 5th International Conference for Emerging Technology (INCET). Piscataway: IEEE Press, 2024: 1-4.

[26]
XU J LIU X JIN J, et al. Holistic service provisioning in a UAV-UGV integrated network for last-mile delivery[J]. IEEE Transactions on Network and Service Management202522(1): 380-393.

[27]
WU Y WU S B HU X T. Cooperative path planning of UAVs & UGVs for a persistent surveillance task in urban environments[J]. IEEE Internet of Things Journal20218(6): 4906-4919.

[28]
DU F J CAO Y WANG Y Z, et al. Research on gridded UAV scheduling based on heuristic greedy algorithm[C]∥2023 International Conference on Image Processing, Computer Vision and Machine Learning (ICICML). Piscataway: IEEE Press, 2024: 989-993.

[29]
WANG R C WANG K SONG W J, et al. Aerial-ground collaborative continuous risk mapping for autonomous driving of unmanned ground vehicle in off-road environments[J]. IEEE Transactions on Aerospace and Electronic Systems202359(6): 9026-9041.

[30]
RIBEIRO C C G DOS SANTOS L H M C MACHARET D G. Collaborative UGV/UAV path planning for inventory management in warehouses[C]∥2022 Latin American Robotics Symposium (LARS), 2022 Brazilian Symposium on Robotics (SBR), and 2022 Workshop on Robotics in Education (WRE). Piscataway: IEEE Press, 2023: 121-126.

[31]
YANG S J YU J H ZHANG Z L, et al. Cooperative path planning method based on road network constraints for vehicle-mounted multi-rotor UAV swarm[C]∥2023 42nd Chinese Control Conference (CCC). Piscataway: IEEE Press, 2023: 1779-1784.

[32]
ZHANG Y X YU J TANG Y J, et al. GACF: Ground-aerial collaborative framework for large-scale emergency rescue scenarios[C]∥2023 IEEE International Conference on Unmanned Systems (ICUS). Piscataway: IEEE Press, 2023: 1701-1707.

[33]
NIU G C WU L GAO Y F, et al. Unmanned aerial vehicle (UAV)-assisted path planning for unmanned ground vehicles (UGVs) via disciplined convex-concave programming[J]. IEEE Transactions on Vehicular Technology202271(7): 6996-7007.

[34]
LI J Q SUN T HUANG X P, et al. A memetic path planning algorithm for unmanned air/ground vehicle cooperative detection systems[J]. IEEE Transactions on Automation Science and Engineering202219(4): 2724-2737.

[35]
MARTÍNEZ-ROZAS S ALEJO D CABALLERO F, et al. Path and trajectory planning of a tethered UAV-UGV marsupial robotic system[J]. IEEE Robotics and Automation Letters20238(10): 6475-6482.

[36]
SEYEDI S YAZICIOĞLU Y AKSARAY D. Persistent surveillance with energy-constrained UAVs and mobile charging stations[J]. IFAC-PapersOnLine201952(20): 193-198.

[37]
XIE X S WANG J S ZHANG Y M, et al. A UAV forest fire detection method based on dual-light vision images[C]∥2023 CAA Symposium on Fault Detection, Supervision and Safety for Technical Processes (SAFEPROCESS). Piscataway: IEEE Press, 2023: 1-6.

[38]
XU S F ZHOU Z Y LIU H Y, et al. A path planning method for collaborative coverage monitoring in urban scenarios[J]. Remote Sensing202416(7): 1152.

[39]
SHI H LIANG Y Q WU B, et al. Time-varying nonparametric remaining useful life of systems based on adaptive kernel auxiliary particle filter[J]. IEEE Transactions on Instrumentation and Measurement202574: 3519414.

[40]
Xu Q Xu J Hu Y, et al. Trajectory optimization of robotic arm based on improved simulated annealing genetic algorithm[J]. Journal of System Simulation202537(2): 404-412.

[41]
WANG Y T SU Z. An envy-free online UAV charging scheme with vehicle-mounted mobile wireless chargers[J]. China Communications202320(8): 89-102.

Outlines

/