面向林火持续侦察的多无人机分布式控制方法

Download PDF 打印本文

文章快速检索

高级检索

引用本文

刘宇轩, 刘虎, 田永亮, 等. 面向林火持续侦察的多无人机分布式控制方法[J]. 航空学报, 2020, 41(2): 323381.

LIU Y X, LIU H, TIAN Y L, et al. Distributed control method of multiple UAVs for persistent wildfire surveillance[J]. Acta Aeronautica et Astronautica Sinica, 2020, 41(2): 323381.

面向林火持续侦察的多无人机分布式控制方法

刘宇轩, 刘虎, 田永亮, 孙聪

北京航空航天大学航空科学与工程学院, 北京 100083

收稿日期: 2019-08-13; 退修日期: 2019-09-11; 录用日期: 2019-10-21; 网络出版时间: 2109-10-25 10:42

通信作者: 田永亮, E-mail：tianyongliang_buaa@163.com

摘要: 为解决目前面向林火持续侦察多无人机（UAV）协同控制实用性与自主性不足的问题，基于蔓延速度诱导元胞自动机（SVICA）林火蔓延算法、无人机与传感器建模，构建了较为真实的三维多无人机火场侦察仿真环境与侦察效能指标，提出了一种面向林火持续侦察的多无人机双层分布式控制架构，在行动层基于强化学习训练的人工神经网络（ANN），实现了有风条件下无人机自主火场环绕与地形跟随功能，在策略层设计通过时域均匀分布算法进行各无人机空速的离散自主调节，最终达到多无人机林火持续侦察时域分布的均匀性与即时性目的。通过一系列数值仿真实验，验证了所提出的无人机分布控制策略在无人机损失和补充突发情况下的自适应性。基于无人机数量与侦察效能指标关系的实验与研究，定义了无人机出动阈值并验证了无人机长时间出动回收策略。最终实验结果表明，针对林火持续侦察任务，所提出的多无人机分布式控制方法具备一定的有效性与实用性。

关键词: 强化学习神经网络多无人机分布式控制林火侦察林火蔓延仿真

Distributed control method of multiple UAVs for persistent wildfire surveillance

LIU Yuxuan, LIU Hu, TIAN Yongliang, SUN Cong

School of Aeronautic Science and Engineering, Beihang University, Beijing 100083, China

Received: 08-13-2019; Revised: 09-11-2019; Accepted: 10-21-2019; Published online: 2109-10-25 10:42

Corresponding author. TIAN Yongliang, E-mail:tianyongliang_buaa@163.com

Abstract: In order to improve the practicality and autonomy in multiple UAV collaborative control for persistent wildfire surveillance, based on the Spread Vector Induced Celluar Automata (SVICA) fire spread algorithm, UAV kinematic, and sensor modeling, a more realistic three-dimension simulation environment for multiple UAV fire surveillance and the surveillance effectiveness indicators are constructed. A two-layer distributed control architecture for multiple UAV is proposed. Based on the reinforcement learning trained Artificial Neural Networks (ANN), the operational layer control realized the autonomous wildfire surrounding and terrain following under windy conditions. In the tactical layer, through the temporal even-distribution algorithm, the discrete airspeed adjustment of each UAV is performed to achieve the uniformity and immediacy of temporal distribution of UAVs in persistent wildfire surveillance. Then through a series of numerical experiments, the adaptability of the proposed distribution control method is verified under sudden UAV loss and supplement during the surveillance. In addition, based on the research on the relationship between the number of UAVs and the surveillance effectiveness, the UAV dispatch threshold is defined and enduring UAV dispatch and recycling strategy is examined. The final simulation results show that the proposed multiple UAV distributed control algorithm is effective and practical for persistent surveillance of wildfire.

Keywords: reinforcement learning artificial neural network multiple UAVs distributed control wildfire surveillance fire spread simulation

森林火灾每年在世界范围内造成巨大的财产损失与人员伤亡^[1]，林火的蔓延受地形、风速风向、林木可燃物载量与含水量分布等多种因素影响，具有一定的不确定性。因此，即时更新的高质量火场信息一方面可以辅助应急处置决策者进行正确的人员与物资的调配^[2]，另一方面，还可以使火场前线的消防人员进行更为安全且高效的林火扑灭操作^[3]。

针对火场信息的获取，传统的地面火场瞭望由于人为误差与视线遮挡等因素，不能准确提供大范围火场信息；卫星遥感数据实时性较差，且分辨率不能满足实际使用需求；而载人飞行器的使用成本较高，机上操作人员的生命往往受到火场复杂环境的威胁^[4-5]。由于现有火场侦察技术的低效，森林消防人员往往在缺乏林火蔓延信息的情况下就进入前线开展扑灭工作，具有极大地人身安全隐患^[3]。因此，有必要发展一种更为经济且高效的林火持续侦察技术，实现对森林消防工作的技术支撑与能力补充。

随着近年来无人机技术与遥测技术的发展，携带视觉(红外或可见光)传感器的多无人机协同火场侦察成为了一种可行的解决方案，并能以相对较低的成本，满足火场信息获取的实时性、准确性和人员安全性的需求^[5-8]。目前，针对多无人机火场侦察技术，国内尚未检索到相关研究，国外研究者主要从2个方面进行了探索。

1) 面向系统集成与实际运用，Martinez-de-Dios等^[9-12]将视觉传感器、惯性导航和GPS等集成在现有无人机平台上，通过多次可控真实火场的实验，充分验证了多无人机林火侦察的技术可行性。此外，Ambrosia和Zajkowski^[13]验证了携带可见光相机低空短航时(Low-Altitude Short-Endurance，LASE)无人机与携带红外相机的中空长航时(Medium-Altitude Long-Endurance，MALE)无人机组合在林火信息收集中的作用。

2) 面向多无人机火场侦察协同控制策略，Casbeer等^[3]假设无人机只能在有限距离内同基站及其他无人机进行火场信息交换，以降低信息交换延迟为协同控制目标，控制无人机对(UAV pair)沿顺时针与逆时针按序出动。在此基础上，Alexis等^[14]假设无人机在汇合后进行折返，并基于火场信息共享与汇合点(rendezvous point)重计算，实现了多无人机在扩张火线上的动态分布。Ghamry和Zhang^[4]基于简化的椭圆火场蔓延模型构建无人机的参考路径，并使用引导-跟随(leader-follower)与滑模控制(Sliding Mode Control，SMC)方法，将多个四旋翼无人机均匀分布在预设的参考路径上。与此方法类似，Sujit等^[6]基于可扩张圆形火场假设，通过拍卖算法研究了多无人机多火点的分配问题，并通过扩张状态控制器使环绕圆形林火边界的无人机等距分布。Kumar等^[15]基于林火边界形状函数构建侦察效用函数，并通过该效用函数梯度下降、无人机间相互作用势函数与人工阻尼量生成每个无人机的控制向量，实现分布式的多无人机协同火场边界侦察。同样是势场控制(Potential Field Control，PFC)，Pham等^[2]基于无人机矩形下视场角模型构建了侦察代价函数，用于实现无人机自主火场覆盖与侦察。

相对于多无人机火场侦察的系统集成与应用，上述分布式或集中式火场侦察协同控制算法仍处于初步的理论研究阶段，且具有如下几个需要改进的地方：

1) 林火蔓延模型过分简化，大部分研究中火线几何形状过于理想化。部分算法需要火线准确的地理几何信息用于生成无人机参考路径或者人工势场。

2) 过分简化的飞行约束，上述二维平面的无人机协同控制算法没有考虑地形对无人机飞行控制的影响；没有根据林火热辐射等因素设置无人机安全飞行约束；没有考虑风速对无人机飞行的影响；并且忽略了烟雾对观测的遮挡作用。

3) 上述算法没有具体定义多无人火场信息侦察效能，并研究火线延长与所需无人机数量的匹配关系。随着无人机数量的增加，上述集中式多无人机控制算法往往具有较大计算成本。

本文针对目前多无人机火场侦察研究中存在的不足，基于经过强化学习训练的神经网络，提出了多无人机分布式双层控制方法，作为初步尝试与创新，本文中的方法是对上述问题的进一步分析与研究，实现了多无人机在局部信息下的火场持续侦察分布式控制。

1 无人机火场侦察建模 1.1 无人机控制模型

本文涉及的无人机控制模型如图 1所示，其主要由3大模块构成，分别是无人机运动学模型、无人机飞控系统与多无人机双层控制架构。

图 1 无人机控制模型 Fig. 1 UAV control model

图选项

首先，对于无人机运动学模型的构建，参考文献[16-17]，在左手直角坐标系下，本文采用如下的固定翼无人机运动学模型作为多无人机双层控制架构的控制对象：

$ \left\{ {\begin{array}{*{20}{l}} {{{\dot x}_i} = {V_i}\cos {\varphi _i}\cos {\psi _i} + {v_{{\rm{w}}x}}}\\ {{{\dot y}_i} = {V_i}\sin {\varphi _i} + {v_{{\rm{w}}y}}}\\ {{{\dot z}_i} = {V_i}\cos {\varphi _i}\sin {\psi _i} + {v_{{\rm{w}}z}}} \end{array}} \right. $	（1）

$ \left\{ {\begin{array}{*{20}{l}} {{{\dot \varphi }_i} = \frac{{{\mathit{\Phi }_{\rm{u}}} + {\mathit{\Phi }_{\rm{d}}}}}{2} + {u_i}\frac{{{\mathit{\Phi }_{\rm{u}}} - {\mathit{\Phi }_{\rm{d}}}}}{2}}\\ {{{\dot \psi }_i} = \frac{{{\mathit{\Psi }_{\rm{l}}} + {\mathit{\Psi }_{\rm{r}}}}}{2} + {v_i}\frac{{{\mathit{\Psi }_{\rm{l}}} - {\mathit{\Psi }_{\rm{r}}}}}{2}} \end{array}} \right. $	（2）

式中：i∈{1, 2, …, N}为无人机索引编号，N为无人机总数；(x_i, y_i, z_i)为无人机空间坐标；V_i为无人机空速控制量(可取3个离散值：最大空速V_max、巡航空速V_c以及最小空速V_min)；φ_i为无人机爬升角；ψ_i为航向角；Φ_u为无人机最大爬升角速度；Φ_d为最小爬升角速度；Ψ_l为无人机最大航向左转角速度；Ψ_r为最大航向右转角速度；[v_wx, v_wy, v_wz]为风速矢量，设风速大小为V_w；u_i、v_i分别为归一化的无人机爬升角与航向角控制变量。

此外，无人机运动模型还应具有如下约束：

$ \left\{ {\begin{array}{*{20}{l}} {{\varphi _{\min }} \le {\varphi _i} \le {\varphi _{\max }}}\\ {\sum\limits_{n = 1}^M {{V_i}} \left( {{t_n}} \right)\Delta t \le {L_{\max }}} \end{array}} \right. $	（3）

式中：φ_min为无人机最小爬升角；φ_max为最大爬升角；Δt为仿真步长；t_n为仿真帧时刻；M为当前帧计数；L_max为最大飞行距离。该约束对无人机的爬升性能和留空时间进行了限制。

其次，无人机运动学模型以多无人机双层控制架构的输出[u_i, v_i, V_i]为输入，基于式(1)与式(2)的微分方程，采用欧拉方法生成控制执行间隔Δt_c后无人机的空间位移量[Δx_{r, i}, Δy_{r, i}, Δz_{r, i}]，并将其作为当前无人机飞控系统的导航参考量。本文假设无人机飞控系统为理想黑盒，在每一个控制时间间隔Δt_c(本文中，Δt_c的导航控制算法，可生成无人机飞行操纵时序的直接控制量(即横纵测三轴与推力控制量)，并通过相应控制机构实现对应舵面偏转与推力增减，最终使得无人机实现给定的参考位移。

最后，多无人机双层控制架构的具体设计与控制量[u_i, v_i, V_i]的生成，将在第3节中详细介绍。

综上所述，本文在无人机实际飞行控制系统之上，通过构建的多无人机双层控制架构与运动学模型，基于理想飞控系统假设，将控制目标从无人机直接操纵量的控制转移到对无人机预期空间位移的控制。因此，本文提出的多无人机双层控制架构的控制对象为上述无人机运动学模型，其中[u_i, v_i, V_i]为相互独立的控制变量。

1.2 林火蔓延模型

作为多无人机协同侦察的对象，林火行为的建模至关重要。一方面，实时甚至是超实时的林火蔓延仿真可以作为虚拟应用环境，辅助设计与检验多无人机协同侦察控制算法。另一方面，在未来的实际使用中，林火蔓延模型可以根据无人机前方侦察到的最新火场情况，对火势的蔓延进行预测，为其他消防力量提供必要的火势预警。

近年来，随着计算机技术的进步，林火建模与仿真有了较大的发展，一系列林火蔓延模型被提出^[18-19]。根据林火呈现形式，火焰蔓延模型主要分为3种：向量模型、栅格模型以及水平集模型^[19]。上述3种模型的优缺点如表 1所示。

表 1 火焰蔓延模型分类 Table 1 Classification of wildfire spread model

模型分类	优点	缺点
向量模型	火线边界无变形	缺乏林火属性，不适用平行计算
栅格模型	空间离散化，便于集成更多林火属性	火线边界变形
水平集模型	火线边界无变形	缺乏林火属性，火线必须封闭

表选项

相较于其他2种模型，林火蔓延栅格模型的离散化林火边界形式(如图 2所示)可以集成更多林火属性(如温度、火焰高度，火线宽度等)，但普遍存在的边界变形问题极大限制了该模型的精度。为此，作为对栅格模型的改进，本团队提出的蔓延速度诱导元胞自动机(SVICA)准经验模型^[19]，在解决边界变形问题的基础上，还体现了地形、风速风向、可燃物载量与含水量分布等因素对林火蔓延的影响。因此，本文采用SVICA林火蔓延模型用于多无人机火场侦察控制算法的辅助设计与仿真验证。

图 2 林火栅格模型 Fig. 2 Raster-based representation of wildfire

图选项

1.3 林火侦察传感器模型

假设无人机可通过机载的惯性测量单元(Inertial Measurement Unit，IMU)、GPS以及陀螺仪无延时准确获取空间位置与运动信息(x_i, y_i, z_i, φ_i, ψ_i)。在此假设基础上，本文控制算法涉及到的机载对地测距与火场侦察传感器的简化建模如图 3所示。

图 3 对地测距传感器模型 Fig. 3 Model of downward ranging sensors

图选项

如图 3所示，处于爬升性能约束内的无人机UAV_i，其机载对地测量传感器实时准确返回无人机的真高D_{0, i}以及无人机铅锤线前向45°对地测距值D_{1, i}。

考虑到能见度与烟雾遮挡等因素，机载林火侦察传感器(可见光与红外相机)有效探测距离设为R_d。如图 4所示，在栅格平面内，假设以无人机质心水平投影为中心，半径为R_d的圆形区域内的所有区块状态信息都可以被传感器实时掌握。此外，以无人机当前航向投影为对称轴，在前向180°范围内，每隔15°计算一次探测范围内无人机质心投影到燃烧区与燃尽区区块的直线距离(若当前角度上全是未燃区，则距离等于R_d)，构成测距集${\tilde R_i} \buildrel \Delta \over = \left\{ {{r_0}, {r_1}, {r_2}, \cdots , {r_{12}}} \right\}$，并使用R_d对测距集R_i每个元素进行归一化，得到归一化测距集${\tilde R_i} \buildrel \Delta \over = \left\{ {{{\tilde r}_0}, {{\tilde r}_1}, {{\tilde r}_2}, \cdots , {{\tilde r}_{12}}} \right\}$作为3.2节无人机控制算法的部分输入项。

图 4 林火侦察传感器模型 Fig. 4 Model of fire detection sensors

图选项

2 约束分析与问题描述

林火蔓延过程产生的大量烟雾，极大地降低了视觉传感器的性能^{[9, 20]}，同时，考虑到飞行安全，无人机不能离火线过近或者穿越火场上空乱流。基于上述分析，无人机需要以较低的高度沿火场外围飞行，执行持续的侦察任务。对于任意无人机UAV_i，需要满足以下约束条件：

$ \left\{ {\begin{array}{*{20}{l}} {\left\| {{D_{0,i}} - {H_{\rm{r}}}} \right\| \le {H_{\rm{t}}}}\\ {{R_{\rm{d}}} \ge \min \left( {{R_i}} \right) \ge {R_{\rm{s}}}}\\ {\left\| {\min \left( {{R_i}} \right) - {R_{\rm{r}}}} \right\| \le {R_{\rm{t}}}} \end{array}} \right. $	（4）

式中：H_r为参考飞行真高；H_t为高度波动阈值；R_s为无人机安全距离；R_r为参考探测距离；R_t为距离浮动阈值；函数min(*)为获取集合中最小元素。

在定义多无人机火场协同侦察整体效能之前，还需要对以下几个概念进行说明。首先，在林火蔓延栅格平面内，每个正方形区块C_{x, z}的边长为a，(xa, za)为当前区块坐标，S_{x, z}为当前区块状态(0为未燃烧，1为正在燃烧，2为已燃尽)。火线上的区块定义为

$ \begin{array}{*{20}{l}} {{C_{{\rm{ff}}}} \buildrel \Delta \over = \left\{ {{C_{x,z}}\left\| {{S_{x,z}} = 1} \right.} \right\} \cap }\\ {\left\{ {{C_{x,z}}\|\exists i,j \in \{ - 1,0,1\} ,{S_{x + i,z + j}} = 0} \right\}} \end{array} $	（5）

此外，每个火线区块对应一个侦测延迟T_{x, z}，初始值为0。当任意无人机首先侦测到火线区块时，所有火线区块的T_{x, z}开始计时。当区块进入任意无人机侦测范围时，该延迟清零；当脱离侦测范围时，重新计时。因此，多无人火场协同侦察效能可用以下几个指标衡量：

$ \left\{ {\begin{array}{*{20}{l}} {E = \frac{1}{{card\left( {{C_{{\rm{ff}}}}} \right)}}\sum\limits_{{C_{x,z}} \in {C_{{\rm{ff}}}}} {{T_{x,z}}} }\\ {S = \sqrt {\frac{1}{{card\left( {{C_{{\rm{ff}}}}} \right)}}\sum\limits_{{C_{x,z}} \in {C_{{\rm{ff}}}}} {{{\left( {{T_{x,z}} - E} \right)}^2}} } }\\ {{T_{\max }} = \max \left( {\left\{ {{T_{x,z}}|{C_{x,z}} \in {C_{{\rm{ff}}}}} \right\}} \right)} \end{array}} \right. $

（6）

式中：card(*)函数为获取集合元素个数；函数max(*)为获取集合中最大元素；E和S分别为所有火线区块侦测延时的期望与标准差；T_max为当前火线侦测延时最大值，该值反映了火线区块被无人机侦察的最大时间间隔。

综上，以动态蔓延的林火为火场侦察的对象，本文提出的多无人机分布式控制方法的控制目标为：首先，在满足所有约束的前提下，实现多架无人机在动态蔓延的林火外围持续飞行。其次，考虑到火场复杂边界形状与风速引起的无人机地速沿飞行路径分布不均匀等问题，提出新的无人机分布控制算法，尽量均匀地降低每个火线区块被无人机侦测的时间间隔，并对不可控坠机与留空时间限制等因素引起的无人机数量变化有动态的适应性，本文将之定义为无人机群环绕路径上动态时域均匀分布问题。最后，本文需要研究不同无人机初始数量与火线区块侦测效能指标的关系，最终验证无人机火场侦察出动策略的设计。

3 无人机双层控制设计 3.1 控制架构

适用于林火持续侦察的多无人机双层控制架构如图 5所示。本文提出的控制架构主要由无人机整体的策略层算法与无人机个体的行动层控制2个层级组成。策略层算法主要由火场侦察参数设置、路径均匀分布控制、航向控制权重生成及发射回收控制策略构成。

图 5 多无人机双层控制架构 Fig. 5 Bi-level control framework of multipe UAVs

图选项

由于本文采用的运动学模型中，航向角控制变量v_i、爬升角控制变量u_i与速度控制变量V_i对无人机预期航迹的控制相互独立，行动层因此可分为3大独立功能：地形跟随、速度调整与航向自主控制。其中，地形跟随功能根据实时对地距离探测信息、当前爬升角信息与参考飞行真高，生成爬升角控制量u_i。速度调整功能包括无人机的定时加速与定时减速2个子功能。根据策略层无人机路径均匀分布算法，实现无人机空速V_i在V_max、V_c以及V_min之间的离散切换。根据任务流程与外界环境因素，航向自主控制功能又由火场环绕、抗风修正与进出火场3个子功能构成。航向控制量v_i最终由上述3子功能控制量输出(v_a、v_f和v_p)加权求和获得：

$ {v_i} = {w_1}{v_{\rm{a}}} + {w_2}{v_{\rm{f}}} + {w_3}{v_{\rm{p}}} $	（7）

式中：w₁、w₂和w₃为航向控制量权重。

综上，无人机UAV_i行动层控制一方面需要无人机的一系列直接观测量，同时还需要来自策略层算法生成的行动层控制变量(即参考飞行高度H_t、加减速时间t_acc和t_dec、参考探测距离R_r、以及参考飞行路径p_r)以及航向自主控制子功能的控制权重。

考虑到多无人机协同控制的复杂度与问题的聚焦度，本文将简化无人机发射回收的流程(包括相关策略层与行动层控制算法的设计)，并将研究重点放在进入火场任务区后无人机协同侦察控制实现与侦察效能分析，具体内容参考。

3.2 行动层控制

在行动层控制的设计中，地形跟随功能与火场环绕功能使用基于强化学习(Reinforcement Learning，RL)的人工神经网络(Artificial Neural Network，ANN)实现输入量与控制量的映射，而抗风修正、定时加减速与进出任务区功能则使用传统的基于人为规则的方式实现。

对于无人机UAV_i，其地形跟随功能ANN的结构如图 6所示，它包含2个隐含层，每层64个神经元；输出层为俯仰控制量u_i；输入层包含3个输入量，分别为s_{1, i}、s_{2, i}和s_{3, i}，其定义为

图 6 地形跟随ANN结构 Fig. 6 ANN structure for terrain following

图选项

$ \left\{ {\begin{array}{*{20}{l}} {{s_{1,i}} = \frac{{2{D_{0,i}} - \sqrt 2 {D_{1,i}}}}{{2\sqrt {D_{0,i}^2 + D_{1,i}^2 - \sqrt 2 {D_{0,i}}{D_{1,i}}} }}}\\ {{s_{2,i}} = \sin {\varphi _i}}\\ {{s_{3,i}} = \frac{{{D_{0,i}} - {H_{\rm{r}}}}}{{{H_{\rm{r}}}}}} \end{array}} \right. $	（8）

对于火场环绕功能ANN，如图 7所示，它包含3个隐含层，每层64个神经元；输出层为火场环绕控制量v_a；输入层包含14个输入量，分别是归一化测距集${\tilde R_i}$的13个元素以及s_0i。其中输入量s_{0, i}的定义为

图 7 火场环绕ANN结构 Fig. 7 ANN structure for wildfire surrounding

图选项

$ {s_{0,i}} = {\rm sgn}\left( {{r_0} - {r_{12}}} \right) $	（9）

式中：函数sgn(*)为符号函数。

本文使用的上述两个人工神经网络ANN皆采用Swish函数^[21]作为神经元的激励函数，使用深度增强学习(PPO)算法^[22]进行训练。其中，地形跟随ANN的训练奖励值R_u定义为

$ {R_{\rm{u}}} = \left\{ {\begin{array}{*{20}{l}} { - 100}&{\left| {{D_{0,i}} - {H_{\rm{r}}}} \right| > {H_{\rm{t}}}}\\ { - 5}&{{H_{\rm{t}}} \ge \left| {{D_{0,i}} - {H_{\rm{r}}}} \right| > 5}\\ { - 1}&{5 \ge \left| {{D_{0,i}} - {H_{\rm{r}}}} \right| > 3}\\ { + 1}&{3 \ge \left| {{D_{0,i}} - {H_{\rm{r}}}} \right| > 1}\\ { + 10}&{1 \ge \left| {{D_{0,i}} - {H_{\rm{r}}}} \right| > 0.1}\\ { + 100}&{0.1 \ge \left| {{D_{0,i}} - {H_{\rm{r}}}} \right|} \end{array}} \right. $

（10）

火场环绕ANN的训练奖励值R_v定义为

$ {R_{\rm{v}}} = \left\{ {\begin{array}{*{20}{l}} { - 100}&{\min \left( {{R_i}} \right) < {R_{\rm{s}}}}\\ { - 1}&{{R_{\rm{r}}} - {R_{\rm{t}}} > \min \left( {{R_i}} \right) \ge {R_{\rm{s}}}}\\ { + 1}&{{R_{\rm{r}}} + {R_{\rm{t}}} \ge \min \left( {{R_i}} \right) \ge {R_{\rm{r}}} - {R_{\rm{t}}}}\\ { - 1}&{{R_{\rm{d}}} > \min \left( {{R_i}} \right) > {R_{\rm{r}}} + {R_{\rm{t}}}}\\ { - 50}&{\min \left( {{R_i}} \right) = {R_{\rm{d}}}} \end{array}} \right. $

（11）

在上述神经网络的强化学习过程中，若训练对象奖励值取得最小值，则重置对象的状态。在完成一定步数的学习后，则停止ANN的强化学习，并按需对神经网络的控制进行一定的人工修正，以实现预期控制目标。

对于行动层抗风修正功能，若只考虑到水平均匀风场对无人机飞行的影响，根据无人机水平速度投影与水平风速的夹角关系，本文采用的比例修正规则为

$ {v_{\rm{f}}} = \left( {{v_{{\rm{w}}x}}\dot z - {v_{{\rm{w}}z}}\dot x} \right)/{V_{\rm{w}}} $	（12）

对于行动层定时加减速功能，若加速时间t_acc和减速时间t_dec都为零，则无人机空速V_i取巡航速度值V_c；若t_acc>0且t_dec=0，则无人机空速V_i在未来t_acc时间内，取最大空速V_max；同理，若t_dec>0且t_acc=0，则无人机空速V_i在未来t_dec时间内，取最小空速V_min。t_acc与t_dec不能同时非零，其值的定义将在策略层部分详细定描述。

最后，对于进出火场功能的实现，如图 8所示，考虑到烟雾飘散方向及安全性等因素，以起火点p_f为起点，沿风速水平投影二维向量反向构建射线，并取射线上与当前火场边界线交点外侧距离为R_r的点作为任务区集结点p_m。假设以p_m为起点，顺时针(或逆时针)垂直于射线$\overrightarrow{p_{\mathrm{f}} p_{\mathrm{m}}}$为无人机的任务区初始参考航向。另一方面，射线$\overrightarrow{p_{\mathrm{f}} p_{\mathrm{m}}}$也作为每个无人机环绕火场的参照物，用于无人机环绕火场周数统计。当无人机留空时间不足时，跨过该射线则立刻执行撤离火场任务区的航向控制命令。

图 8 进出火场任务区假设 Fig. 8 Mission zone entering and exiting assumptions

图选项

进出任务区航向控制首先使用Dubins ^[23]方法在策略层进行参考路径的规划，即生成无人机发射点(或回收点)与任务区集结点p_m之间的水平投影路径。然后根据当前无人机与参考路径之间的距离及无人机航向，构建简化的比例引导控制，最终生成对应航向控制量v_p。由于进出火场任务区的航向控制并不是本文研究的重点，为了无人机协同火场侦察任务流程完整性，故只对其实现进行方法上的论述。在具体研究中，无人机进出火场任务区的控制将简化为无人机在任务集结点p_m的出动与回收问题。

3.3 策略层设计

作为多无人机火场侦察的协同控制的核心，策略层算法首先通过火场侦察参数设置模块，设定每个无人机UAV_i何时进入任务区并按照给定的参考飞行高度H_r与侦察距离R_r开始环绕火场飞行。无人机群在环绕火场侦察的过程中，每个无人机即时局部的观测量被收集起来，用以实现火场态势的整体态势感知。

其次，策略层路径均匀分布控制模块基于累计飞行距离等信息，实现无人机群在环绕路径时域上的近似均匀分布，其具体算法如下：

假定所有无人机按统一方向(顺时针或逆时针)沿火场外围飞行，无人机可随时通过机间通信，动态确定环绕先后顺序与当前运行无人机总数N。以最开始进入火场的无人机为1号机，对无人机UAV_i按照式(13)赋予设置出动顺序与队列编号X_i，若出现插队或掉队的无人机，则立即对无人机群的索引与队列编号进行更新。

$ {X_i} = i\;\;\;\;i \in \{ 1,2, \cdots ,N\} $	（13）

以无人机跨过射线$\overrightarrow {{p_{\rm{f}}}{p_{\rm{m}}}} $时刻为里程记录起止点，所有无人机按等时间间隔Δt(Δt为计算帧时长)在一个环绕火场周期内累计各自里程，并设无人机在时刻nΔt(n∈N)的里程为L_{i, n}。所有无人机用最新时刻的L_{i, n}更新当前单周内里程L_{one, i}，并记录总飞行里程L_{e, i}；1号无人机UAV₁还需要将当前环绕圈内每一时刻nΔt的L_{1, n}存储在集合L_all中。当任意无人机UAV_i到达记录起止点时，可用当前其单周内里程L_{one, i}估计标准单周里程L_{c, i}，然后将L_{one, i}归零重新累计，同时向所有无人机广播其队列编号X_i；若到达起止点的无人机为UAV₁，则还需向所有无人机广播L_all以及标准单周里程L_{c, 1}。

当无人机UAV_k (k∈{1, 2, …, N})到达记录起止点时，考虑达到火场面积的增加对无人机路径的延长作用，任意无人机UAV_i可在接收的最新L_all中可查找对应时刻n_i的里程，并定义其标准路径里程L_{std, i}为

$ {L_{{\rm{std}}{{\rm{,}}_i}}} = \frac{{{L_{1,{n_i}}}{L_{{\rm{c}},k}}}}{{{L_{{\rm{c}},1}}}}\;\;\;\;{L_{1,{n_i}}} \in {L_{{\rm{all}}}} $	（14）

式中：n_i为无人机UAV_i标准里程在L_all的索引编号，可通过式(15)计算：

$ {n_i} = \left\{ {\begin{array}{*{20}{l}} {\frac{{ {\rm card} \left( {{L_{{\rm{all}}}}} \right)\left( {{X_k} - {X_i}} \right)}}{N}}&{{X_i} \le {X_k}}\\ {\frac{{ {\rm card} \left( {{L_{{\rm{all}}}}} \right)\left( {N + {X_k} - {X_i}} \right)}}{N}}&{{X_i} > {X_k}} \end{array}} \right. $	（15）

当所有无人机完成L_{std, i}(i∈{1, 2, …, N})的更新，定义当前标准路径偏移量L_offset为

$ {L_{{\rm{offset}}}} = {L_{{\rm{one}},1}} - {L_{{\rm{std}},1}} $	（16）

然后，根据当前各自路径里程L_{one, _i}与标准里程L_{std, i}及L_offset，任意无人机UAV_i定时加速时间t_{acc, i}与定时减速时间t_{dec, i}的计算方法为

若L_{std, i}－L_{one, i}+L_offset≥0，则无人机UAV_i当前里程相对理想里程滞后，加速时间t_{acc, i}为

$ {t_{{\rm{acc}},i}} = \frac{{{L_{{\rm{std}},i}} - {L_{{\rm{one}},i}} + {L_{{\rm{offset}}}}}}{{{V_{{\rm{max}}}} - {V_{\rm{c}}}}} $	（17）

同理，若L_{std, i}－L_{one, i}+L_offset < 0，则无人机当前里程相对理想里程超前，减速时间t_{dec, i}为

$ {t_{{\rm{dec}},i}} = \frac{{{L_{{\rm{one}},i}} - {L_{{\rm{std}},i}} - {L_{{\rm{offset}}}}}}{{{V_{\rm{c}}} - {V_{{\rm{min}}}}}} $	（18）

基于上述计算，在下一个无人机到达起止点前，任意UAV_i将按照最大空速V_max(或V_min)立刻执行持续t_{acc, i}(或t_{dec, i})时间的加速飞行(或减速飞行)，并在结束时恢复巡航空速V_c。此外，若环绕火场的无人机数量N发生变化时，则需要重新计算各无人机t_{acc, i}和t_{dec, i}，并立即执行对应定时加减速飞行。在上述算法的设计中，为了获得每一圈标准的里程集合L_all，1号无人机UAV₁始终以巡航空速V_c环绕火场。综上可知，随着无人机依次抵达里程记录起止点并触发所有无人机定时加减速操作，无人机群将逐步实现环绕火场路径时域上的动态均匀分布。

然后，针对航向控制权重的生成，本文考虑风速对无人机航向的影响，策略层算法通过在特定时间点改变航向控制权重值，实现无人机火场环绕与进出任务区行动间的切换，其对应的权值(w₁, w₂, w₃)为

$ \left( {{w_1},{w_2},{w_3}} \right) = \left\{ \begin{array}{l} \left( {{k_{\rm{a}}},1 - {k_{\rm{a}}},0} \right)\;\;\;\;\;火场环绕\\ \left( {0,1 - {k_{\rm{p}}},{k_{\rm{p}}}} \right)\;\;\;\;\;进出任务区 \end{array} \right. $	（19）

式中：k_a和k_p为控制量比例系数，用于调整风速修正项在航向控制v_i的比例，系数的大小与风速大小相关。k_a具体数值的计算将在实验部分给出，k_p由于进出任务区控制的简化，将不在本文中具体讨论。

最后，本文假定无人机发射点(或回收点)就在当前的任务区集结点p_m，即策略层发射回收控制策略模块只考虑在留空约束与不可抗力损失情况下，无人机的出动与回收规则。为了简化起见，无人机的出动采取连续等时间间隔发射的形式，每个无人机初始位置与航向满足图 8所示要求。对于无人机回收，当任意无人机UAV_i经过射线 $\overrightarrow {{P_{\text{f}}}{P_{\text{m}}}} $时，若L_max－L_{e, i}小于当前单周飞行路径总长度估计值L_{c, i}，则判定无人机立刻回收，脱离侦察序列。同时，新的无人机可以在任意时刻按照需求在点p_m发射，作为协同侦察力量的补充维持火场侦察的效能。具体的无人机发射与回收想定参考仿真实验部分。

4 仿真实验与结果分析

本文使用Unity^[24]作为仿真实验平台，并使用ML-agents工具箱^[25]实现基于PPO算法的神经网络训练。

如图 9所示，Unity中大地直角坐标系为左手坐标系，无人机航迹坐标轴及无人机运动模型变量(x_i, y_i, z_i, φ_i, ψ_i)的定义如图 9所示。对于质心处在点o_i的无人机UAV_i，航迹轴z_{k, i}指向无人机的地速方向，x_{k, i}始终与水平面平行。

图 9 Unity平台下坐标系说明 Fig. 9 Description of coordinate system in Unity

图选项

为了充分验证本文提出的多无人机分布式火场侦察控制算法，林火蔓延仿真部分沿用SVICA模型复现的希腊斯佩特塞斯岛1990年森林火灾的案例^[19]。仿真的结果如图 10所示，随着仿真的进行，从起火点向外，每小时火带位置与形状被记录下来，最终仿真的11小时过火面积与真实过火面积误差在3.22%^[19]，仿真的火焰蔓延行为具有较高的可信度。同时，对于无人机飞行的影响因素，本文继续沿用案例^[19]构建的岛屿三维地形及风速设定，三维地形如图 11所示，风场为均匀水平北风，风速为10 m/s。

图 10 SVICA林火蔓延仿真结果 Fig. 10 Simulation results of wildfire spread using SVICA model

图选项

图 11 Unity中斯佩特塞斯岛屿三维地形 Fig. 11 3D terrain of Spetses island in Unity

图选项

基于表 2所列参数值，将首先在无风情况下完成地形跟随与火场环绕两个ANN的训练，之后在考虑风速情况下，通过实验获取最佳的航向控制量比例系数k_a，最终完成整个多无人机分布式控制架构。最后，通过一系列的动态火场蔓延侦察实验，验证本文提出的控制方法。

表 2 仿真参数列表 Table 2 Parameters for simulation

参数符号	参数意义	数值
V_c/(m·s^-1)	无人机巡航空速	30
V_max/(m·s^-1)	无人机最大空速	40
V_min/(m·s^-1)	无人机最小空速	20
Φ_u/((°)·s^-1)	最大爬升角速度	60
Φ_d/((°)·s^-1)	最小爬升角速度	-60
Ψ_r/((°)·s^-1)	最大航向右转角速度	60
Ψ_l/((°)·s^-1)	最大航向左转角速度	-60
V_w/(m·s^-1)	风速	10
(v_wx, v_wy, v_wz)/(m·s^-1)	风速向量	(0, 0, -10)
φ_max/(°)	最大爬升角	30
φ_min/(°)	最小爬升角	-30
R_d/m	有效探测距离	200
R_s/m	安全距离	40
R_t/m	距离浮动阈值	10
R_r/m	参考探测距离	100
H_t/m	高度浮动阈值	10
H_r/m	参考飞行真高	50
a/m	栅格尺寸	20
L_max/km	最大飞行距离	50

表选项

在进行环绕火场ANN训练之前，首先在如图 10所示的三维地形上，使用5架相邻的无人机以不同的随机初始高度按照式(10)给出的奖励值，通过PPO算法进行3倍速仿真加速学习。以2 000步为一个训练周期，共20万步的ANN学习情况如图 12(a)所示。

图 12 ANN训练结果 Fig. 12 ANN training results

图选项

其后，结合训练好的地形跟随ANN，在图 13所示的2小时(自起火计时)仿真蔓延形成的静态火场，进行火场环绕ANN的训练。在两个重置坐标p_s1和p_s2以及对应重置航向上，各放飞5架无人机，并按照式(11)给出的奖励值，同样使用PPO算法进行3倍速仿真加速学习。总计20万步的强化学习仍以2 000步为一个周期，火场环绕ANN的训练结果如图 12(b)所示。

图 13 ANN训练用仿真静态火场 Fig. 13 Static simulated wildfire for ANN training

图选项

基于无风条件下完成训练的地形跟随与火场环绕两个ANN，在10 m/s北风条件下，使用图 13所示静态火场，以不同的控制量比例系数k_a，在对应p_m处顺时针放飞单无人机UAV₁，通过实时仿真(未加速)，研究其一周最近火场测距min(R₁)的变化情况，其标准差与平均值的实验结果如图 14所示。

图 14 不同k_a对火场环绕的影响 Fig. 14 Effects on wildfire surrounding with different k_a

图选项

考虑到参考探测距离为100 m，k_a在0.92处取得最小的最近测距标准差15.64 m以及局部较大的平均值93.50 m。为了保证风速影响下无人机环绕火场的距离稳定性，本文在后续实验中，令k_a=0.92。至此，面向林火持续侦察的多无人机分布式控制架构完成构建，下面将通过一系列仿真实验对该架构进行验证与分析。

假设所有无人机在火场蔓延两小时开始自图 13所示的任务区集结点p_m按图示方向顺时针进入火场，初始速度为V_c，以第1个无人机进入火场时刻为计时零点，无人机之间进入时间间隔为T_gap。根据无人机发射回收设定，当无人机由于航程L_max限制自动脱离环绕序列，假设立刻有一无人机自脱离位置补充进侦察队列。

在检验多无人机火场协同侦察之前，先通过单无人机UAV₁的动态火场环绕飞行实时仿真，测试无人机行动层控制的效果。单无人机UAV₁在第一圈环绕火场的爬升与航向角控制情况如下。

如图 15所示，在行动层控制模块的作用下，无人机UAV₁能够在参考飞行真高H_r=50 m上下约1 m范围内保持定高飞行，在参考探测距离R_r=100 m上下约40 m范围内保持与火场的水平距离，且大于无人机安全距离R_s=40 m。由此可见，在风速及动态火场不规则外形等因素的共同作用下，无人机的航向探测距离的维持虽然波动较大，但基本满足飞行安全约束。图 16通过正交与透视投影直观展示了无人机UAV₁火场环绕的三维航迹线。

图 15 无人机UAV₁爬升和航向控制情况 Fig. 15 Climbing and heading control results of UAV₁

图选项

图 16 无人机UAV₁环绕火场第一圈航迹线 Fig. 16 Trajectory of UAV₁ during the first wildfire surrounding cycle

图选项

在行动层火场环绕与地形跟随功能完成验证的基础上，下面测试多无人机路径时域均匀分布算法的有效性以及对无人机数量变化的动态适应。

假定5架无人机按照T_gap=10 s的时间间隔从p_m依次发射，分别进行2次持续时间1 000 s的5倍速超实时仿真实验：一个保持5架无人机初始出动间隔作为对照组实验，另一个使用本文提出的均匀分布方法控制无人机适当加减速。两次实验记录的3个火场协同侦察效能指标的变化情况如图 17和图 18所示。

图 17 效能指标T_max的变化情况 Fig. 17 Evolution of the effectiveness indicatorT_max

图选项

图 18 效能指标E和S的变化情况 Fig. 18 Evolution of the effectiveness indicators E and S

图选项

从图 17和图 18可知，当1号无人机在115.2 s完成第1圈侦察之前，所有无人机保持初始的出动间隔环绕火场，2次实验对应的火线侦测延时期望E和标准差S以及侦测延时最大值T_max的变化相同。对于使用时域均匀分布方法的那5架无人机，当1号无人机在115.2 s跨过里程记录起止点后，方法开始控制无人机群进行适当的加减速以完成时间间隔上的均匀分布。可见经过后续2周的动态调整，当1号无人机在341.9 s第3次跨过里程记录起止点后，火场协同侦察效能指标的变化趋于稳定，并以相邻2个无人机时间间隔为周期小幅震荡，且都随着火场面积的增大有小幅度的增涨趋势。反观没有使用均匀分布方法的那5架无人机火场侦察结果，由于风速造成无人机地速的不一致性与无人机群的相对密集的分布，对应的3个效能指标都在115.2 s后呈现大幅度周期性震荡，且震荡周期与无人机环绕火场一周用时基本一致。

2次实验分别取342~1 000 s的结果进行统计，可得使用均匀分布方法的5架无人机E的平均值为2.66 s，S的均值为3.78 s，T_max的均值为13.84 s，分别远远小于未使用均匀分布方法E的平均值17.03 s、S的均值19.74 s以及T_max的61.98 s。稳定且较小的E、S和T_max意味着，每个火线区块被无人机群以较小时间间隔均匀的探测，无人机群的火场侦察能力得到了较为充分的利用。

在此基础上，考虑无人机的数量的变化对均匀分布方法效果的影响。同样使用5架无人机进行2次持续1 000 s的5倍速超实时仿真实验。在都使用均匀分布方法的情况下，一次实验在第500 s时去掉队列编号为2的无人机，另一个实验于第500 s时在p_m处再加入1架无人机。

实验结果如图 19和图 20所示，在无人机群已处于稳定均匀分布情况下，添加或去除一个无人机，侦测延时期望E和标准差S在经过一定时间的震荡，在约600 s后趋于稳定，无人机群重新恢复到当前数量下的稳定均匀分布状态。具体而言，使用两次测试600~1 000 s数据进行统计，并与图 17与图 18(b)所示的未改变无人机数量的情况作对比：补充一个无人机后，6架无人机侦察下E的平均值下降到1.57 s，S的均值降为2.55 s，T_max的均值将至10.23 s；损失1个无人机后，在4架无人机侦察下E的平均值增加到为5.00 s，S的均值增至5.93 s，T_max的均值增加到20.12 s。

图 19 无人机补充或损失情况下E和S的变化情况 Fig. 19 Evolution of E and S with UAV loss or replenishment

图选项

图 20 无人机补充或损失情况下效能指标T_max的变化情况 Fig. 20 Evolution of effectiveness indicator T_max with UAV loss or replenishment

图选项

通过上述实验可知，本文提出的分布式控制方法可实现无人机群火场环绕路径上时域的动态分布，且对于无人机数量的变化具有较高的鲁棒性。下面通过一系列5倍速超实时仿真实验具体研究无人机数量对火场侦察效能的影响。

进行10次持续1 000 s的实验，无人机总数量N从1增加到10，采用每次实验500~1 000 s的E、S和T_max的数据分别对其均值$\bar E$、$\mathit{\bar S}$和$\bar T$_max进行统计，其结果如表 3所示。

表 3 无人机数量变化对效能指标影响 Table 3 Effect of UAV number variation on effectiveness indicators

无人机数量	效能指标
无人机数量	E/s	S/s	T_max/s
1	44.80	32.54	105.93
2	18.14	15.61	49.32
3	9.13	9.26	29.70
4	4.92	5.86	19.85
5	2.73	3.86	14.02
6	1.55	2.52	10.10
7	0.90	1.61	7.34
8	0.55	0.99	5.28
9	0.36	0.57	3.66
10	0.26	0.30	2.36

表选项

由图 21可知，无人机单周环绕火场路径长度在这1 000 s仿真过程中呈线性增长，线性增长率约为0.37 m/s，进而可推知火场边界线的长度在上述仿真过程中也呈线性增长趋势。在这种火场扩张近似稳定情况下，由表 3所列的10次实验可以得出，随着无人机数量的增加，3个协同火场侦察效能指标快速下降，火场的态势感知的实时性与均匀性显著提高。

图 21 10架UAV均匀分布方法单周标准里程变化 Fig. 21 Evolution of single-cycle trajectory length estimation with 10 UAVs using even-distributed method

图选项

以上基于效能指标的实验分析都是建立在火场蔓延仿真基础上的，实际无人机出动策略只能根据环绕火场无人机收集到的局部信息进行汇总制定。在一定的无人机探测距离R_d、无人机到火线水平距离及复杂火场边界线形状等条件下，T_max实际反映了在动态均匀分布下，相邻无人机探测区域间的间隔时间尺度，该值与无人机单周标准里程有一定的关系。假定均匀分布下无人机速度为V_c，基于表 2的T_max数据以及500 s到1 000 s单周标准里程均值3 403.76 m，来估算不同无人机数量下每个无人机有效路径覆盖半径r_cover，结果如表 4所示。

表 4 无有效覆盖半径r_cover计算结果 Table 4 Calculation results of r_cover

无人机数量	r_cover/m
1	112.90
2	111.21
3	121.80
4	127.72
5	130.04
6	132.14
7	133.04
8	133.59
9	134.24
10	134.75

表选项

随着火线上无人机数量的增加，即相邻无人机距离的减少，由于不规则火场边界线导致的相邻无人机探测区域的不定时重叠，使得无人机有效覆盖半径r_cover有所增加。本文取其平均值r_cover=127.15 m用于接下来无人机持续侦察出动策略的构建。

在火场侦察时，实时准确的火场蔓延信息只有通过无缝侦察实现(即T_max=0 s)，这就要求无人机的过度部署。而实际上从成本因素考虑，适当的探测区域间隔在不影响火场态势感知的前提下是被允许的。因此，基于当前到达起始点无人机UAV_i的单周标准里程估计L_{c, i}，以及无人机有效覆盖半径r_cover的估计，在不同无人机数量下，可以对T_max按式(20)进行反向估算，设估算值为T′_max，该值称为无人机的出动阈值。

$ {{T'}_{\max }} = \frac{1}{{{V_{\rm{c}}}}}\left( {\frac{{{L_{{\rm{c}},i}}}}{N} - 2{{\bar r}_{{\rm{cover}}}}} \right) $	（20）

考虑到无人机的最大飞行距离L_max的约束，假定在p_m处需要回收的无人机能立刻被新的无人机补充替换，并设定无人机群环绕火场500 s后，无人机出动阈值最大为15 s，当T′_max超过该值后，一架增援无人机立刻在p_m发射。为了验证上述无人机的出动策略，下面使用初始5架无人机进入已蔓延2小时的仿真火场进行持续2小时的侦察实验，其结果如图 22所示。

图 22 2小时持续侦察测试结果 Fig. 22 Test results for two-hour persistent surveillance

图选项

由图 22实验结果可知，在500~7 200 s的无人机群环绕火场持续侦察实验中，上述出动回收策略按照指定阈值T′_max控制无人机的补充，分别在第1 075 s、3 195 s和5 604 s各增加了一架增援无人机。具体而言，由于航程限制，初始的5架无人机都进行了4次替换，后3架增援无人机分别进行了3次、2次和0次替换，2小时持续侦察实验总共投入28架次无人机。参考图 22中虚线标注的区域，由于火场的不规则蔓延，部分火线区块被包含在已经燃尽的区块内部，且超出环绕火场无人机的侦测距离，在其自动熄灭前造成了T_max的异常增高(特别是2 749 s到3 157 s区间内，T_max一度达到279 s)，进而使全局的E和S显著增高。实际情况中，被过火区域包围的火线不具有安全威胁，这些异常增高区间可忽略。

在持续2小时的火场侦察中，无人机单周标准里程估计由最初的3 163.0 m增加到了5 493.3 m，上述无人机出动回收规则首先较好的估计了T_max的增长趋势，其次适时出动的增援无人机，使得3个侦察指标控制在了可接受的范围内。实验结果充分证明了本文提出的多无人机分布式控制方法在动态火场持续侦察上的可行性与有效性。

5 结论

1) 在作者以往林火蔓延仿真研究的基础上，通过对无人机及传感器的建模，完成了较为复杂的仿真环境的构建。在此基础上，提出了多无人机持续火场侦察的效能指标。

2) 建立了多无人机分布式双层控制架构，并基于PPO强化学习算法完成了无人机行动层火场环绕与地形跟随两个ANN训练，并通过人工抗风修正方法实现了无人机基于局部侦察信息的自主火场环绕。在此基础上，提出了多无人机火场侦察时域均匀分布的速度调整方法，实现对无人机群在数量可变情况下，等时间间隔火场环绕的动态控制。

3) 通过一系列仿真实验与效能指标分析，本文提出的多无人机分布式控制方法得到充分的验证。在此基础上，通过对无人机数量与火场侦察效能的分析，提出了无人机出动阈值的概念，并通过长时间的仿真火场侦察实验，综合验证了本文提出的多无人机分布式控制架构在火场持续侦察任务中的可行性。

参考文献

[1]	TAO S, ZHANG L, CHEN W, et al. Mountains forest fire spread simulator based on geo-cellular automaton combined with Wang Zhengfei velocity model[J]. IEEE Journal of Selected Topics in Applied Earth Observations & Remote Sensing, 2013, 6(4): 1971-1987.
	Click to display the text
[2]	PHAM H X, LA H M, FEIL-SEIFER D, et al. A distributed control framework for a team of unmanned aerial vehicles for dynamic wildfire tracking[C]//2017 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS). Piscataway, NJ: IEEE Press, 2017: 6648-6653.

[3]	CASBEER D W, KINGSTON D B, BEARD R W, et al. Cooperative forest fire surveillance using a team of small unmanned air vehicles[J]. International Journal of Systems Science, 2006, 37(6): 351-360.
	Click to display the text
[4]	GHAMRY K A, ZHANG Y. Cooperative control of multiple UAVs for forest fire monitoring and detection[C]//2016 12th IEEE/ASME International Conference on Mechatronic and Embedded Systems and Applications (MESA). Piscataway, NJ: IEEE Press, 2016: 1-6.

[5]	YUAN C, ZHANG Y, LIU Z. A survey on technologies for automatic forest fire monitoring, detection, and fighting using unmanned aerial vehicles and remote sensing techniques[J]. Canadian Journal of Forest Research, 2015, 45(7): 783-792.
	Click to display the text
[6]	SUJIT P B, KINGSTON D, BEARD R. Cooperative forest fire monitoring using multiple UAVs[C]//2007 46th IEEE Conference on Decision and Control. Piscataway, NJ: IEEE Press, 2007: 4875-4880.

[7]	AMBROSIA V G, ZAJKOWSKI T. Selection of appropriate class UAS/sensors to support fire monitoring:Experiences in the United States[J]. Handbook of Unmanned Aerial Vehicles, 2015, 2723-2754.
	Click to display the text
[8]	AKHLOUFI M A, CASTRO N A, COUTURIER A. UAVs for wildland fires[C]//Autonomous Systems: Sensors, Vehicles, Security, and the Internet of Everything, 2018.

[9]	MARTÍNEZ-DE-DIOS J R, MERINO L, OLLERO A, et al. Multiple heterogeneous unmanned aerial vehicles[M]. Berlin: Springer, 2007: 207-228.

[10]	MERINO L, CABALLERO F, MARTÍNEZ-DE-DIOS J R, et al. Automatic forest fire monitoring and measurement using unmanned aerial vehicles[C]//Proceedings of the 6th International Congress on Forest Fire Research, 2010.

[11]	MERINO L, CABALLERO F, MARTÍNEZ-DE-DIOS J R, et al. An unmanned aircraft system for automatic forest fire monitoring and measurement[J]. Journal of Intelligent & Robotic Systems, 2012, 65(1-4): 533-548.
	Click to display the text
[12]	MERINO L, MARTÍNEZ-DE DIOS J R, OLLERO A. Cooperative unmanned aerial systems for fire detection, monitoring, and extinguishing[M]//Handbook of Unmanned Aerial Vehicles. Dordrecht:Springer, 2015:2693-2722.

[13]	AMBROSIA V G, ZAJKOWSKI T. Selection of appropriate class UAS/sensors to support fire monitoring:experiences in the United States[M]//Handbook of Unmanned Aerial Vehicles. Dordrecht:Springer, 2015:2723-2754.

[14]	ALEXIS K, NIKOLAKOPOULOS G, TZES A, et al. Applications of intelligent control to engineering systems[M]. Dordrecht: Springer, 2009.

[15]	KUMAR M, COHEN K, HOMCHAUDHURI B. Cooperative control of multiple uninhabited aerial vehicles for monitoring and fighting wildfires[J]. Journal of Aerospace Computing, Information, and Communication, 2011, 8(1): 1-16.
	Click to display the text
[16]	王祝, 刘莉, 龙腾, 等. 基于罚函数序列凸规划的多无人机轨迹规划[J]. 航空学报, 2016, 37(10): 3149-3158. WANG Z, LIU L, LONG T, et al. Trajectory planning for multi-UAVs using penalty sequential convex programming[J]. Acta Aeronautica et Astronautica Sinica, 2016, 37(10): 3149-3158. (in Chinese)
	Cited By in Cnki \| Click to display the text
[17]	YAO P, WANG H, SU Z. Cooperative path planning with applications to target tracking and obstacle avoidance for multi-UAVs[J]. Aerospace Science and Technology, 2016, 54: 10-22.
	Click to display the text
[18]	SULLIVAN A L. Wildland surface fire spread modelling, 1990-2007.3:Simulation and mathematical analogue models[J]. International Journal of Wildland Fire, 2009, 18(4): 387-403.
	Click to display the text
[19]	LIU Y, LIU H, ZHOU Y, et al. Spread vector induced cellular automata model for real-time crown fire behavior simulation[J]. Environmental Modelling & Software, 2018, 108: 14-39.
	Click to display the text
[20]	MARTÍNEZ-DE DIOS J, MERINO L, CABALLERO F, et al. Automatic forest-fire measuring using ground stations and unmanned aerial systems[J]. Sensors, 2011, 11(6): 6328-6353.
	Click to display the text
[21]	RAMACHANDRAN P, ZOPH B, LE Q V. Searching for activation functions[EB/OL]. (2017-10-27)[2019-08-06]. https://arxiv.org/abs/1710.05941.

[22]	SCHULMAN J, WOLSKI F, DHARIWAL P, et al. Proximal policy optimization algorithms[EB/OL]. (2017-08-28)[2019-08-06]. https://arxiv.org/abs/1707.06347.

[23]	LUGO-CARDENAS I, FLORES G, SALAZAR S, et al. Dubins path generation for a fixed wing UAV[C]//2014 International conference on unmanned aircraft systems (ICUAS). Piscataway, NJ: IEEE Press, 2014: 339-346.

[24]	Unity Technologies. Unity[EB/OL].[2019-08-06]. http://unity3d.com.

[25]	JULIANI A, BERGES V, VCKAY E, et al. Unity: A general platform for intelligent agents[EB/OL]. (2018-09-07)[2019-08-06]. https://arxiv.org/abs/1809.02627.

http://dx.doi.org/10.7527/S1000-6893.2019.23381
中国航空学会和北京航空航天大学主办。

文章信息

刘宇轩, 刘虎, 田永亮, 孙聪

LIU Yuxuan, LIU Hu, TIAN Yongliang, SUN Cong

面向林火持续侦察的多无人机分布式控制方法

Distributed control method of multiple UAVs for persistent wildfire surveillance

航空学报, 2020, 41(2): 323381.

Acta Aeronautica et Astronautica Sinica, 2020, 41(2): 323381.

http://dx.doi.org/10.7527/S1000-6893.2019.23381

文章历史

收稿日期: 2019-08-13

退修日期: 2019-09-11

录用日期: 2019-10-21

网络出版时间: 2109-10-25 10:42

文章信息

文章历史

相关文章

工作空间