文章快速检索  
  高级检索
启发式多无人机协同路网持续监视轨迹规划
王通1,2, 黄攀峰1,2, 董刚奇1,2     
1. 西北工业大学 航天学院, 西安 710072;
2. 西北工业大学 航天飞行动力学技术重点实验室, 西安 710072
摘要: 研究了旋翼无人机组在路网环境下的协同持续监视问题。基于最优化原理定义了路网持续监视问题。通过简化路网离散过程、考虑传感器识别准确度、引入不确定度度量,提出面向事件的路网持续监视问题建模方法。针对路网持续监视轨迹规划问题的特殊性,设计了一种启发式多无人机协同轨迹规划算法。通过理论分析和仿真对比,表明了算法的可行性、准确性和通用性。所提算法作为对当前路网巡逻方法的扩充,不仅可解决实际路网移动持续监视任务,也为基于图模型的持续数据采集、连续覆盖等任务提供一种解决方案。
关键词: 启发式算法    多无人机    协同    传感器覆盖    路网    持续监视    
Cooperation path planning of multi-UAV in road-network continuous monitoring
WANG Tong1,2, HUANG Panfeng1,2, DONG Gangqi1,2     
1. School of Astronautics, Northwestern Polytechnical University, Xi'an 710072, China;
2. National Key Laboratory of Aerospace Flight Dynamics, Northwestern Polytechnical University, Xi'an 710072, China
Abstract: In this paper, the problem of continuous monitoring of rotor UAVs in road-network environment is studied. Based on the optimization principle, the multi-UAVs road-network continuous monitoring problem is defined. By simplifying the discrete process for environment, considering the detection accuracy of sensors, and introducing uncertainty measurement, a model for road-network continuous monitoring is constructed. To address the particularity of path planning in continuous monitoring, a heuristic multi-UAVs cooperative path planning algorithm is designed. The theoretical analysis and simulation comparison verify the feasibility, accuracy, and generality of the proposed algorithm in multi-UAVs road-network continuous monitoring. As an extension of road-network patrolling method, this algorithm can not only provide a solution for the continuous monitoring task of road-network, but also be applied to the persistent data collection and continuous coverage tasks based on the graph model.
Keywords: heuristic algorithm    multi-UAVs    cooperation    sensor coverage    road-network    continuous monitoring    

以不间断更新目标区域信息为目标的移动持续监视,是实现战场态势感知的基础,对战场搜索、入侵检测、安防等具有重要意义[1],同时,也可广泛应用于人群和社会运动监测[2]、交通管控[3]、环境调查[4]、精确农业[5]、森林火灾监控等[6]民事任务中。

随着自动化水平的提升,旋翼无人机(UAV)因机动能力强、移动速度快、监视范围大的优点,被广泛应用于持续监视任务中[7]。实际中,由于旋翼无人机飞行高度约束,在城市、大型工厂等复杂环境中,无人机必须沿着实际道路网进行移动。然而,已有的持续监视研究普遍处理平面内无障碍的场景[8-9],很少关注对路网区域的持续监视问题。事实上,路网持续监视的场景广泛存在于现实任务,比如,无人车在校园道路上巡逻或检测异常[10]、无人船在河道网络中检测事故或收集水文信息[4]、移动传感器在精确农业中监控田间气体湿度等相关数据[11]

路网持续监视可以抽象为具有一定覆盖范围的移动单元在网络拓扑结构上连续移动以寻求整体最优效果的新问题。因此,监视问题的建模和移动单元的轨迹规划是路网持续监视的2个关键问题。现有的研究中,与路网持续监视问题最相似的是多机器人巡逻问题。巡逻问题解决如何最小化无向图中所有巡逻点2次访问的时间间隔[12]的问题,其问题建模时直接以时间变量[13]及其相应的变种[14-15]为评价指标,存在“所至即覆盖”的假设,不考虑传感器的实际监视效果[16]。在轨迹规划方面,现有的巡逻路径规划方法可分为循环路径(闭路径)模式、区域分割模式和随机模式3类。循环模式的目的是为各移动单元规划一条统一的路径[10],各单元以等间距或等时间间隔编队移动[17],此模式的好处在于任务周期内轨迹已知,利于系统的规划和决策,且被证明是可使所有兴趣点的最大间隔时间最小的最优巡逻模式[15],缺点是周期化的轨迹极容易被反侦察,同时不能适应巡逻环境的动态扩展。区域分割模式中,基于各种图分割[18]或区域分割[19]技术为每个移动单元生成单独巡逻路径,通过规划各单元的巡逻速度和停留时间实现一定的均衡性和随机性,但分区策略在面对智能攻击者时的表现不如非分区方法[12]。随机方法规划出的巡逻轨迹,相对于反侦察者而言是不可预知的,因此更适合防渗透的安防监视和态势感知任务。目前的随机轨迹生成方法主要分为反应式、认知式、概率式和学习式。反应式方法是指依靠局部信息驱动机器人运动的方法[20],诸如分布式协调方法[21]、基于贪婪策略的方法[22]、基于信息素的群智能方法[23]也可归为反应式方法;认知式方法是指依靠全局信息驱动机器人运动的方法[24];概率式方法是指基于概率模型的机器人轨迹生成方法[25],如基于蒙特卡罗搜索树[26]和贝叶斯学习[27]等方法;学习式方法是基于人工智能技术驱动机器人运动的方法,如使用安全博弈[28]、强化学习[29]等,但学习式的方法训练成本大,尤其是大型地图上[30]

与巡逻问题不同,在路网持续监视问题中,由于无人机具有一定的感知范围,无人机不必到达每个节点,而是到达可以完全监视目标节点的节点即可。由此可见,路网持续监视的轨迹规划问题是“区域到区域”的规划,由于路网的强约束性,获得使区域内各节点的监视效果最佳的无人机最优轨迹相当困难,而巡逻问题针对“点到点”的规划,因此,目前的多机器人巡逻问题的轨迹规划算法无法直接应用于路网持续监视问题中。本文研究多无人机路网持续监视问题,提出一种多无人机协同持续监视轨迹规划算法。首先,定义多无人机路网持续监视问题,给出该问题的严格的数学表达形式;其次,构造了适合多机协同持续监视的决策量;然后,考虑到传感器的监视准确度,从全局协作的角度设计了一种简单有效的轨迹规划算法。

本文其他部分内容如下:第1节,建立了路网持续监视模型,构造了不确定度度量,并公式化我们的问题;第2节,构造无人机持续监视轨迹规划决策量,基于启发式认知架构和集中式协作策略提出了持续监视轨迹规划算法;第3节,建立了性能评价指标,对多机持续监视算法进行仿真与性能分析,表明协同持续监视算法的准确性和通用性;最后,给出了本工作的研究结论。

1 路网持续监视问题建模 1.1 问题描述

本质上讲,无人机路网持续监视的任务场景是一个事件发生位置和时间均未知的区域。尽管精确的发生时间未知,但事件的持续时间是先验可知的[31]。因此,持续监视不同于一般的警务巡逻问题[32]。在警务巡逻问题中,不同位置的犯罪发生率是先验的,且对各个位置的达到频率没有特殊要求[13]。在持续监视中,任务区域应以一定的频率被不间断地覆盖访问。因此,持续监视任务中无人机的基本行动原则是最优化一个与监视效果相关的指标。通过最小化该指标,事件被监视的可能性将被最大化。考虑无人机传感器监视准确度的影响,路网持续监视问题定义如下。

定义1    多无人机路网持续监视为一组在一片未知事件发生概率和位置的路网区域上移动的具有一定覆盖范围的无人机寻找各自的移动轨迹,以最优化一个与监视效果相关的指标。

1.2 环境离散化模型

路网持续监视建模是轨迹规划的基础。将连续地图构建为由监视指标反映的离散模型,是监视问题中的常用方法[8]。路网持续监视任务中无人机必须沿地面道路网的拓扑结构移动。按照实际路网的拓扑结构,沿道路中心线将路网中的道路标出,将所有道路表示为集合形式,记W={W1, W2, …, Wm},将所有道路所连接的两侧端点表示为集合形式,记I={I1, I2, …, Iu};取le为允许建模偏差,对于非直线道路,将其离散为多条直线段代替,每条直线段段与实际道路Wi间的最大距离不大于允许建模偏差le。将离散出的所有直线段的端点记为V={V1, V2, …, VN},根据道路拓扑结构将各相邻点连接形成边,由此构造无向带权图G=(V, E),其中,带权边(va, vb)∈E表示无人机从兴趣点va到点vb的实际路程,而两点间的坐标距离为实际距离。

1.3 监视指标构建

考虑到实际传感器网络的动力学特性,构造不确定度[33]作为监测点决策属性。在不确定度度量中,考虑无人机的传感器监视识别能力、不同监测点的监视优先级和监测点2次被完全覆盖所经历的时间间隔。

首先考虑传感器识别准确度模型。为了不失通用性,不针对任何传感器产品或监视系统,而是假设一个通用关系。传感器识别准确度与移动速度、探测距离和环境复杂度等有关,在我们的模型中,假设无人机移动速度相同,同时假设区域环境复杂度相似,因此传感器识别准确度仅与探测距离有关,距离越近识别准确度越高,反之越低,达到一定距离后将无法识别。因此,将传感器识别准确度建立为分段概率函数形式:

$ {f_{\rm{c}}} = \left\{ {\begin{array}{*{20}{l}} 1&{d \le {d_{\rm{c}}}}\\ {\left( {{d_{\rm{c}}} - d} \right)/\left( {{d_1} - {d_{\rm{c}}}} \right) + 1}&{{d_{\rm{c}}} < d \le {d_1}}\\ 0&{d > {d_1}} \end{array}} \right. $ (1)
 

式中:d为某一点到传感器中心的距离;dc为完全探测范围;dl为可探测极限。

当存在多个传感器对同一监测点进行监测时,采用概率叠加原理[34],传感器的联合监测错误度为所有传感器都识别错误的概率Fci,即

$ {F_{{\rm{c}}i}} = \prod\limits_{r = 1}^{{R_i}} {\left( {1 - {f_{{\rm{c}}r}}} \right)} $ (2)
 

式中:Ri为覆盖第i个监测点的无人机个数;fcr为第r个无人机对i点的传感器识别准确度。

其次考虑监测点i被2次完全识别的间隔时间tai,表示为

$ {t_{{\rm{a}}i}} = {t_k} - {t_{{\rm{lv}}i}} $ (3)
 

式中:tk为当前系统时间;tlvi为第i个点上次被完全识别时的系统时间。

最后考虑监视等级, 采用线性权重的方式,令每个点具有不同的不确定度增长速率,以满足对某区域的重点监视要求。将三者联合,不确定度会随着时间增加和传感器准确度的下降而增加,因此构造不确定度属性为线性函数:

$ {\delta _i} = {\sigma _i}\left( {{t_k} - {t_{{\rm{lv}}i}}} \right)\prod\limits_{r = 1}^{{R_i}} {\left( {1 - {f_{{\rm{c}}r}}} \right)} $ (4)
 

式中:σii点监视权重;σiσσ为监视权重矩阵;δii点的不确定度。

1.4 不确定度归一化

注意到此时不确定度的量纲为时间单位(s),实际上不确定度的物理意义是一个“程度”或“可能性”,这是个无量纲的指标,因此采用归一化方式,令当前不确定度除以一个关于时间的上限tlim,得到归一化不确定度度量:

$ \delta _i^N = {\sigma _i}\left( {{t_k} - {t_{1{\rm{v}}i}}} \right)\prod\limits_{r = 1}^{{R_i}} {\left( {1 - {f_{{\rm{c}}r}}} \right)} /{t_{{\rm{lim}}}} $ (5)
 

定义归一化不确定度具有以下性质:当某点处的传感器联合监测错误度为0,则该点不确定度为0,其访问时间间隔为0;当传感器联合错误度不为0时,则采用式(5)计算归一化不确定度,归一化不确定度上限为1。

1.5 问题公式化

为定量描述路网持续监视问题,定义一个可反映所有监视点被监视情况的变量作为持续监视的目标函数,记C1

$ {C_1} = \frac{1}{N}\sum\limits_{i = 1}^N {\delta _{ji}^N} $ (6)
 

式中:δjiN为第i个监视点在第j个时刻的归一化不确定度。

因此,路网持续监视问题可以被公式化为:在道路拓扑结构G=(V, E)、传感器识别准确度fc、监视权重σ的约束下,为一组无人机R寻找各自的轨迹XTr以最小化C1

2 多无人机持续监视轨迹规划

将定义1中的轨迹规划计算过程视为每一时刻对无人机位置的决策,因此需要构造决策量并制定决策方法。这一部分中,首先定义持续监视的决策量,然后考虑单无人机沿路网进行持续监视时的轨迹规划情况,再考虑多无人机协同持续监视问题,最后分析了算法的计算复杂度。

2.1 决策量设计

为达到降低不确定度的目的,应驱使无人机向不确定度高的区域移动。考虑到实际运行路径,无人机向某个点移动会产生时间成本[9],因此,不可直接按照不确定度进行决策,需要设置一个包含移动距离的收益函数。

与固定翼无人机、无人船可在地图内自由移动不同,路网持续监视任务中的旋翼无人机须沿着实际道路行驶。构造归一化不确定度和无人机移动距离的函数,表示无人机对第i个点的持续监视收益值,以此作为无人机轨迹规划中的决策量。同时考虑不确定度的动态特性,构造持续监视收益公式为

$ {A_{ir}} = \delta _i^N - {q_w}d_{\min }^r/\left( {{\sigma _i}{v_r}{t_{\lim }}} \right) $ (7)
 

式中:Air为无人机r到第i个点的收益;qw为收益系数;dminr为无人机r到目标点的可覆盖最短路长度,可覆盖最短路的含义如图 1所示;vr为无人机r的速度。

图 1 可覆盖最短路 Fig. 1 Shortest observable path

定义2    (完全覆盖点)与目标点相关,当无人机抵达该点时,可实现对目标点的完全覆盖。

定义3    (可覆盖最短路)无人机从当前位置移动到目标点的各个完全覆盖点,其中所有路径中距离最短的路径。

2.2 单无人机轨迹规划方法

启发式算法可通过为个体设置简单行动规则获得近似全局最优的效果,是解决复杂路径规划问题的常用思路[22]。为了达到最大化路网监视效果,令每个无人机向自身全局最大收益位置移动。选用Warshall-Floyd算法计算最短路径。

为了保证算法的全局持续监视效果且避免局部不确定度异常,要求我们应同时考虑全局和局部决策规则。设置了3个基本规则,分别是决策简化、折返抑制和防止停留。

1) 决策简化:为简化决策难度,规定当无人机抵达监测点时才进行规划,规划后将沿着此方向一直移动直至下一监测点。由于实际数值离散精度原因,当无人机实际位置到监测点位置的距离dr≤0.5vrdt时,则无人机抵达,其中,dt为算法的规划时间步长。

2) 折返抑制:由于路网的复杂拓扑结构,无法准确判断无人机原路返回是否不利于减小整体监视不确定度,因此允许无人机原路折返,但根据各点的度dgi确定无人机在该点的折返概率,取折返的概率Pb满足:

$ {p_{\rm{b}}} = \left\{ {\begin{array}{*{20}{l}} 1&{{d_{{\rm{g}}i}} = 1}\\ {0.4/{d_{{\rm{g}}i}}}&{{d_{{\rm{g}}i}} > 1} \end{array}} \right. $ (8)
 

3) 防止停留:当无人机在某监测点停留时,系统将随机指定该点所有连接的边中的一个,作为下一时刻的前进方向。

2.3 多无人机协作决策方法

文献[35]指出多机器人系统的个体最优性往往不能直接扩展到群体,需通过合理的协同提高群体性能。在单无人机决策基础上,采用集中式协作策略,期望通过全局调控,达到降低平均不确定度和最大不确定度的目的。为降低决策复杂度,减小计算时间,构造2个简单协作规则。

1) 减少轨迹重复:无人机经过某边或即将经过某边时,向其他无人机报告,其他无人机在规划时将尽量减少经过此边的概率。

该协作策略的目的是减少无人机间的重复轨迹,以减少对某些点的重复监视。每次决策前,无人机获取各边被占用情况,若某边被其他无人机使用,则将相应边的路径值修改为一个大数。

2) 分散布局:无人机选中目标点后,通知其他无人机,其他无人机将远离该目标点。

该协作的目的是降低多无人机同时向相邻区域移动的可能性,使其分散布置,以防止部分区域长期未被监测。每次决策前,无人机计算到各点的收益,同时获取其他无人机的目标点及目标点邻接点的序号,将对应的自身收益修改为0。

两个协作策略均期望算法在随机基础上平均化监视效果。最终的多无人机协同路网持续监视算法伪代码如算法1所示。

算法1  多无人机协同路网持续监视算法
Load  G=(V, E),fcσ=[σ1, σ2, …, σN]
Input   TR,ΔtvrX0rtlim
Output  无人机轨迹XTr
1  计算各监视点的完全覆盖点
2  for  任务期T内的每隔规划步长dtj
3  δiN≤每个监视点的归一化不确定度
4  for  每个无人机r
5    报告自身位置与前进方向
6    if  抵达某个监视点
7      获取其他无人机的位置与前进方向
8      减小轨迹重复
9      分散布局
10      寻找max Air的监视点
11      计算去往max Air处的可覆盖最短路
12      if 新方向与原方向相反
13      折返抑制
14      elseif  无人机停留
15      防止停留
16        选定新方向
17     往新方向移动
2.4 算法复杂度分析

关注无人机一次决策(算法1第6~第17步)的计算时间复杂度。很明显,算法1的第6、12、14、16、17步中,仅一次计算,故复杂度为O(1)。算法1第7步为协作过程,待规划无人机向其他无人机索要位置和目标信息,因此复杂度为O(R-1)。算法1第8步中,待规划无人机根据其他无人机数据修改对应的自身路径成本,故复杂度亦为O(R-1)。算法1第9步中,需计算每个点的所有完全覆盖点到当前位置的最短路,记第i点的完全覆盖点个数为noi,则需计算O(Nnoi)次。本算法采用Warshall-Floyd算法计算最短路,其复杂度为O(N3),故算法1第9步的复杂度为O(N4noi)。算法1第10步为取最值过程,复杂度为O(N)。算法1第11步中,可根据目标点序号读取在算法1第9步中计算出的可覆盖最短路,故该步复杂度为O(1)。算法1第13步与算法1第15步均需寻找当前位置的邻接点,故复杂度为O(N)。将算法1第6~17步所有步骤的复杂度叠加,则无人机一次决策的计算复杂度最大为O(N4·max noi)。

3 仿真与结果 3.1 性能评价指标

本文采用的评价指标如下:平均不确定度(C1)、稳定后的最大间隔时间(C2)、稳定后的平均不确定度均值(C3)、稳定后的平均不确定度标准差(C4),具体形式如下。

1) 平均不确定度指每个时步中所有监测点的归一化不确定度的平均值,计算方法见式(6)。

2) 最大间隔时间是从稳定监视状态至任务结束,各监视点的归一化不确定度的最大值。其中,无人机的稳定监视状态为无人机至少完成一次全区域覆盖后的时间。

3) 平均不确定度均值是从稳定监视状态至任务结束,区域内各点归一化不确定度的均值:

$ {C_3} = \frac{1}{{T - {t_{\rm{w}}} + 1}}\sum\limits_{j = {t_{\rm{w}}}}^T {\delta _j^N} $ (9)
 

式中:tw为稳定状态的起始时间。

4) 平均不确定度方差是从稳定监视状态至任务结束,区域内各点归一化不确定度的标准差:

$ {C_4} = \sqrt {\frac{1}{{T - {t_{\rm{w}}} + 1}}\sum\limits_{j = {t_{\rm{w}}}}^T {{{\left( {\delta _j^N - {C_3}} \right)}^2}} } $ (10)
 
3.2 仿真结果

为检验算法在不同地图中的可行性与有效性,设置3个在连通度、监视点分布、拓扑结构方面不同的虚拟路网模型,如图 2所示,分别记为G1G2G3,3个模型均设置64个点。其中,G2G3分别模拟低连通度和高连通度路网,二者各点均匀分布,最短边长度为100 m,覆盖面积为490 000 m2G1中点和边的分布不均,且包含多个度为1的点,具有一般性,其最短边长度为30 m,最长边长度为120 m,覆盖面积为494 000 m2。为了突出算法的性能,假设路网中无人机无监测障碍且忽略旋翼无人机的转弯和调头时间。按照从左到右、从下到上的顺序对路网模型中的监测点进行编号。为了分析监视权重对算法性能的影响,设置2种监视权重矩阵。一组为“标准权重”,记作SW:在1~64中随机选取8个数,作为高优先级监视点的编号,并在(1, 2]内随机生成8个数作为高优先级监测点的监视权重,其他56个点的监视权重取1;另一组为“均一权重”,记作AW:其中64个点的监视权重均设置为1。

图 2 路网模型图 Fig. 2 Model of road-network

设置仿真基本条件:Δt=1 s、T=10 000 s、vr=10 m/s、R=3、tw=1 000 s、tlim=1 000 s、qw=3.5。本文所有仿真结果均来自于一台CPU为Intel Core i7-7700(3.6 GHz)、显卡为Nvidia Geforce GT730(2 GB)、内存为Samsung DDR4(4 GB)的台式机上的Matlab®2017b软件。

3.2.1 算法的准确性

为说明算法在不同覆盖范围、监视等级和路网拓扑下的普遍规律,设置4组条件。条件1:AW & dc=10 m,条件2:SW & dc=10 m,条件3:AW & dc=100 m,条件4:SW & dc=100 m。图 3表 1展示了不同条件下的算法性能。

图 3 不同场景下的平均不确定度 Fig. 3 Average value of uncertainty in different conditions
表 1 不同场景下的持续监视指标 Table 1 Performance criteria in different conditions

路网
编号
监视
权重
完全探测
范围dc/m
最大不确
定度C2
平均不确定
度均值C3
平均不确定
度方差C4
G1AW100.625 80.143 80.016 1
1000.581 60.082 20.017 0
2000.454 60.027 90.012 1
SW100.763 80.151 00.017 5
1000.605 20.084 40.015 6
2000.550 40.028 10.011 7
G2AW100.532 80.141 60.019 6
1000.395 40.048 90.009 3
2000.313 80.020 40.011 3
SW100.773 00.145 60.015 1
1000.468 50.054 90.010 5
2000.365 20.021 50.011 8
G2AW100.417 40.134 80.010 2
1000.496 60.062 80.011 0
2000.367 60.013 30.005 3
SW100.633 70.148 70.009 7
1000.523 80.070 00.012 1
2000.553 00.013 90.005 3

图 3所示,在任一拓扑结构路网模型中,各监视点的平均不确定度均随任务时间增长而逐渐下降,在达到一个极小值后开始往复震荡,震荡域相对较小,可见达到了减小整体不确定度的效果,从而表明算法实现了不同覆盖范围的无人机组对不同监视等级的不同拓扑结构的路网区域的持续监视。

表 1所示,比较相同监视权重、不同探测范围场景的平均不确定度情况。可见,随探测范围增加,平均不确定度的下降速度加快同时稳定后的均值降低。事实上,探测范围增加将会提高整体的监视效果。再比较相同探测范围、不同监视权重场景的平均不确定度情况。可见,监视权重的增加加大了稳定后的不确定度均值和方差。这是由于监视权重的差异打破了原有的访问均衡性,加大了无人机的轨迹随机性,使得算法性能受到影响。由此可见,算法在不同探测范围、不同监视等级和不同拓扑结构地图下所反映的规律与事实相符,表明了本文算法的准确性。

3.2.2 算法的通用性

图 3图 4的结果表明所提算法对多机器人巡逻问题和路网持续监视问题的通用性。由图 3图 4可见,当探测范围dc=10 m时,均一权重场景下的无人机完成了对所有观测点的遍历,且监视点的平均不确定度趋于稳定。注意到不确定度式(4),当监视权重传感器探测极限dl小于各路网点间最小欧氏距离(G1路网中任意2点间欧氏距离最小值为20 m)时,不确定度实则直接反映了各兴趣点的访问间隔时间。由此可以认为,当前普遍研究的基于间隔时间的多机器人巡逻问题是本文研究的基于传感器监视准确度的路网持续监视问题的特例。由此表明,所提算法也是对巡逻模型的一种解法,且为更一般的通用解法。

图 4 G1模型中不同监视权重下的最大不确定度 Fig. 4 Maximum uncertainty of G1 with different conditions
3.2.3 算法的有效性

为验证2.3节协作规则的有效性,在不同拓扑结构的路网模型中进行协同效果测试。设置3组仿真,第1组不含协作,第2组仅含第1种协作,第3组含2种协作。3组仿真分别标记为S1~S3。在“均一权重”和基本仿真条件下,分别取dc=10 m、dc=100 m和dc=200 m,仿真结果如图 5所示。

图 5所示,尽管路网模型的拓扑结构差异较大,但随着协同的加入,算法性能在不同路网模型中的变化规律相似。对比任一相同路网模型中的3组仿真结果,稳定后的最大不确定度C2、平均不确定度均值C3和平均不确定度方差C4随着协同的加入均逐渐减小,说明2种协同的加入有效提高了算法的效率,并有效减少了系统随机性的影响,提高了算法的持续监视能力,使整体性能更加稳定。

图 5 不同协作模式下的算法性能 Fig. 5 Performance criteria in different cooperation modes
3.2.4 算法的可扩展性

无人机团队存在中途加入或退出时对算法性能的影响一般也被称为算法的可扩展性,这是算法实时性能的体现。在基本仿真条件下,分别取dc=10 m和dc=100 m,并设置3组仿真条件,标记为S1~S3。第1组中,无人机开始有5个,运行至4 000 s时,随机选择一架使其停止运行,至7 000 s时,再随机选择一架使其停止运行;第2组中,无人机个数始终为5个;第3组中,无人机开始有5个,运行至4 000 s时,于初始位置增加一架进入任务,至7 000 s时,再于初始位置增加一架。第1组仿真用以模拟无人机失效场景,第2组模拟正常任务场景,第3组模拟增援场景。由于可扩展性并不受路网拓扑结构影响,故仅选择G1路网进行算法的可扩展性测试。

图 6所示,3组场景的不确定度均值C3和最大不确定度C2,随无人机数目增加逐渐减小,且增援场景的C4明显小于失效场景的C4值,说明无人机增援提升了持续监视性能。然而,尽管在增援场景中增加了无人机的个数,C4仍高于正常任务场景下的C4值,说明无人机数目变化增加了对持续监视系统的扰动。以上分析表明,算法实现了在无人机数目变化情况下的持续监视,准确反映了增援和失效场景中的监视效果变化规律,具有良好的可扩展性。

图 6 无人机数目变化对算法性能的影响 Fig. 6 Variation of performance criteria with number of UAVs
4 结论

1) 定义了无人机路网持续监视问题,建立了基于传感器监视准确度的持续监视问题模型,提出了协同持续监视轨迹规划算法。

2) 所提算法对基于间隔时间的多机器人巡逻问题和基于传感器监视准确度的路网持续监视问题具有通用性。

3) 所提算法具有离线和在线规划能力,解决了多无人机协同路网持续监视轨迹规划问题,同时也为基于图模型的持续数据采集、连续覆盖等任务提供了一种有效的解决方案。

参考文献
[1] RASMUSSEN S, KALYANAM K, KINGSTON D. Field experiment of a fully autonomous multiple UAV/UGS intruder detection and monitoring system[C]//2016 International Conference on Unmanned Aircraft Systems (ICUAS), 2016.
[2] TROTTA A, FELICE M D, MONTORI F, et al. Joint coverage, connectivity, and charging strategies for distributed UAV networks[J]. IEEE Transactions on Robotics, 2018, 34(4): 883-900.
Click to display the text
[3] GARCIA A P, ROLDAN J J, BARRIENTOS A. Monitoring traffic in future cities with aerial swarms:Developing and optimizing a behavior-based surveillance algorithm[J]. Cognitive Systems Research, 2019, 54: 273-286.
Click to display the text
[4] ABBASI F, MESBAHI A, VELNI J M. A new voronoi-based blanket coverage control method for moving sensor networks[J]. IEEE Transactions on Control Systems Technology, 2019, 27(1): 409-417.
Click to display the text
[5] ROLDAN J J, GARCIA A P, GARZON M, et al. Heterogeneous multi-robot system for mapping environmental variables of greenhouses[J]. Sensors, 2016, 16(7): 1018.
Click to display the text
[6] KHAN A, RINNER B, CAVALLARO A. Cooperative robots to observe moving targets:Review[J]. IEEE Transactions on Cybernetics, 2018, 48(1): 187-198.
Click to display the text
[7] KOLLING A, KLEINER A, CARPIN S. Coordinated search with multiple robots arranged in line formations[J]. IEEE Transactions on Robotics, 2018, 34(2): 459-473.
Click to display the text
[8] THAKOOR O, GARG J, NAGI R. Multiagent UAV routing:A game theory analysis with tight price of anarchy bounds[J]. IEEE Transactions on Automation Science and Engineering, 2019, 17(11): 1-17.
Click to display the text
[9] NIGAM N, BIENIAWSKI S, KROO I, et al. Control of multiple UAVs for persistent surveillance:Algorithm and flight test results[J]. IEEE Transactions on Control Systems Technology, 2012, 20(5): 1236-1251.
Click to display the text
[10] PASQUALETTI F, FRANCHI A, BULLO F. On cooperative patrolling:Optimal trajectories, complexity analysis, and approximation algorithms[J]. IEEE Transactions on Robotics, 2012, 28(3): 592-606.
Click to display the text
[11] TOKEKAR P, HOOK J V, MULLA D, et al. Sensor planning for a symbiotic UAV and UGV system for precision agriculture[J]. IEEE Transactions on Robotics, 2016, 32(6): 1498-1511.
Click to display the text
[12] PORTUGAL D, ROCHA R. A survey on multi-robot patrolling algorithms[M]. Berlin: Springer, 2011.
[13] ALAMDARI S, FATA E, SMITH S L. Persistent monitoring in discrete environments:Minimizing the maximum weighted latency between observations[J]. The International Journal of Robotics Research, 2014, 33(1): 138-154.
Click to display the text
[14] YANOVSKI V, WAGNER I A, BRUCKSTEIN A M. A distributed ant algorithm for protect efficiently patrolling a network[J]. Algorithmica, 2003, 37(3): 165-186.
Click to display the text
[15] CHEN H, CHENG T, WISE S. Developing an online cooperative police patrol routing strategy[J]. Computers, Environment and Urban Systems, 2017, 62: 19-29.
Click to display the text
[16] PASQUALETTI F, DURHAM J W, BULLO F. Cooperative patrolling via weighted tours:Performance analysis and distributed algorithms[J]. IEEE Transactions on Robotics, 2012, 28(5): 1181-1188.
Click to display the text
[17] CHEVALEYRE Y. Theoretical analysis of the multi-agent patrolling problem[C]//IEEE/WIC/ACM International Conference on Intelligent Agent Technology. Piscataway: IEEE Press, 2004.
[18] WIANDT B, SIMON V. Autonomous graph partitioning for multi-agent patrolling problems[C]//Federated Conference on Computer Science and Information Systems, 2018.
[19] CHEN H, CHENG T, YE X. Designing efficient and balanced police patrol districts on an urban street network[J]. International Journal of Geographical Information Science, 2019, 33(2): 269-290.
Click to display the text
[20] TURNER J, MENG Q, SCHAEFER G, et al. Distributed task rescheduling with time constraints for the optimization of total task allocations in a multi-robot system[J]. IEEE Transactions on Cybernetics, 2018, 48(9): 2583-2597.
Click to display the text
[21] ARSLAN O, KODITSCHEK D E. Sensor-based reactive navigation in unknown convex sphere worlds unknown convex sphere worlds[J]. The International Journal of Robotics Research, 2019, 38(2-3): 196-223.
Click to display the text
[22] AZEVEDO S P, SILVA S R, NAZARIO R A. Reducing the range of perception in multi-agent patrolling strategies[J]. Journal of Intelligent & Robotic Systems, 2018, 91(2): 219-231.
Click to display the text
[23] WAGNER I A, ALTSHULER Y, YANOVSKI V, et al. Cooperative cleaners:A study in ant robotics[J]. The International Journal of Robotics Research, 2008, 27(1): 127-151.
Click to display the text
[24] PARK C, KIM Y, JEONG B. Heuristics for determining a patrol path of an unmanned combat vehicle[J]. Computers & Industrial Engineering, 2012, 63(1): 150-160.
Click to display the text
[25] HOSHINO S, ISHIWATA T. Probabilistic surveillance by mobile robot for unknown intruders[C]//2015 IEEE/RSJ International Conference on Intelligent Robots and Systems (IROS). Piscataway: IEEE Press, 2015.
[26] CHEN S, WU F, SHEN L, et al. Decentralized patrolling under constraints in dynamic environments[J]. IEEE Transactions on Cybernetics, 2016, 46(12): 3364-3376.
Click to display the text
[27] PORTUGAL D, ROCHA R P. Cooperative multi-robot patrol with Bayesian learning[J]. Autonomous Robots, 2016, 40(5): 929-953.
Click to display the text
[28] PITA J, JAIN M, ORDONEZ F, et al. Using game theory for Los Angeles airport security[J]. AI Magazine, 2009, 30(1): 43-57.
Click to display the text
[29] BOGERT K, DOSHI P. Multi-robot inverse reinforcement learning under occlusion with estimation of state transitions[J]. Artificial Intelligence, 2018, 263: 46-73.
Click to display the text
[30] HUANG L, ZHOU M, HAO K, et al. A survey of multi-robot regular and adversarial patrolling[J]. IEEE/CAA Journal of Automatica Sinica, 2019, 6(4): 894-903.
Click to display the text
[31] YU J, KARAMAN S, RUS D. Persistent monitoring of events with stochastic arrivals at multiple stations[J]. IEEE Transactions on Robotics, 2015, 31(3): 521-535.
Click to display the text
[32] CHEN H, CHENG T, SHAWE T J. A balanced route design for min-max multiple-depot rural postman problem(MMMDRPP):A police patrolling case[J]. International Journal of Geographical Information Science, 2018, 32(1): 169-190.
Click to display the text
[33] WALLAR A, PLAKU E, SOFGE D A. Reactive motion planning for unmanned aerial surveillance of risk-sensitive areas[J]. IEEE Transactions on Automation Science and Engineering, 2015, 12(3): 969-980.
Click to display the text
[34] SRIVASTAVA V, PASQUALETTI F, BULLO F. Stochastic surveillance strategies for spatial quickest detection[J]. The International Journal of Robotics Research, 2013, 32(12): 1438-1458.
Click to display the text
[35] NIGAM N. The multiple unmanned air vehicle persistent surveillance problem:A review[J]. Machines, 2014, 2(1): 13-69.
Click to display the text
http://dx.doi.org/10.7527/S1000-6893.2019.23753
中国航空学会和北京航空航天大学主办。
0

文章信息

王通, 黄攀峰, 董刚奇
WANG Tong, HUANG Panfeng, DONG Gangqi
启发式多无人机协同路网持续监视轨迹规划
Cooperation path planning of multi-UAV in road-network continuous monitoring
航空学报, 2020, 41(S1): 723753.
Acta Aeronautica et Astronautica Sinica, 2020, 41(S1): 723753.
http://dx.doi.org/10.7527/S1000-6893.2019.23753

文章历史

收稿日期: 2019-12-13
退修日期: 2019-12-25
录用日期: 2019-12-31
网络出版时间: 2019-12-31 08:15

相关文章

工作空间