电子电气工程与控制

历史轨迹驱动无人机自主着陆迭代学习控制

  • 田秋扬 1, 2 ,
  • 王泽林 1, 2 ,
  • 胡天江 , 1, 2, 3
展开
  • 1. 中山大学 航空航天学院,深圳 518107
  • 2. 群体智能与无人系统珠海市重点实验室,珠海 519000
  • 3. 中山大学 人工智能学院,珠海 519000
.E-mail:

收稿日期: 2025-07-28

  修回日期: 2025-08-11

  录用日期: 2025-09-23

  网络出版日期: 2025-10-17

基金资助

国家自然科学基金(61973327)

History-trajectory-driven iterative learning control for autonomous fixed-wing UAV landing

  • Qiuyang TIAN 1, 2 ,
  • Zelin WANG 1, 2 ,
  • Tianjiang HU , 1, 2, 3
Expand
  • 1. School of Aeronautics and Astronautics,Sun Yat-Sen University,Shenzhen 518107,China
  • 2. Zhuhai Key Laboratory of Collective Intelligence and Unmanned Systems,Zhuhai 519000,China
  • 3. School of Artificial Intelligence,Sun Yat-Sen University,Zhuhai 519000,China

Received date: 2025-07-28

  Revised date: 2025-08-11

  Accepted date: 2025-09-23

  Online published: 2025-10-17

Supported by

National Natural Science Foundation of China(61973327)

摘要

小型固定翼无人机(UAVs)在林业、消防等低空经济领域已广泛应用,其任务执行常需依赖可靠的自主着陆能力。尽管着陆过程中无人机的位姿模态变化具有重复性,但受低空风扰及初始状态随机偏移影响,实际着陆轨迹易出现轨迹长度波动并威胁着陆安全。针对此问题,提出一种基于历史轨迹驱动的迭代学习控制(ILC)方案。该方案在迭代维度上,利用历史轨迹数据优化期望着陆轨迹,间接降低跟踪误差,既兼容现有飞控框架又避免频繁调参;在时间维度上,采用动态时间规整(DTW)算法对多架次历史轨迹进行非线性对齐,突破了传统迭代学习要求轨迹长度严格一致的约束,并确保了迭代收敛性。仿真验证结果表明,相较于传统自动驾驶仪,该方案使着陆轨迹的横侧向和纵向跟踪误差均降低50%以上,有效提升了自主着陆的成功率与安全性。

本文引用格式

田秋扬 , 王泽林 , 胡天江 . 历史轨迹驱动无人机自主着陆迭代学习控制[J]. 航空学报, 2026 , 47(7) : 332634 -332634 . DOI: 10.7527/S1000-6893.2025.32634

Abstract

Small fixed-wing Unmanned Aerial Vehicles (UAVs) have been widely adopted in low-altitude economic sectors such as forestry and firefighting, where reliable autonomous landing capabilities are essential for mission execution. Although the positional and attitude modal changes of UAVs during landing exhibit repetitive patterns, low-altitude wind disturbances and random initial state deviations frequently cause fluctuations in trajectory length, compromising landing safety. To address this issue, this paper proposes a historical-trajectory-driven Iterative Learning Control (ILC) scheme. At the iterative dimension, the scheme optimizes the desired landing trajectory by leveraging historical trajectory data, indirectly reducing tracking errors while maintaining compatibility with existing flight control frameworks and avoiding frequent parameter adjustments. At the temporal dimension, the Dynamic Time Warping (DTW) algorithm is employed to nonlinearly align multi-sortie historical trajectories across time and space. This approach overcomes the traditional iterative learning constraint requiring strictly identical desired trajectories while ensuring iterative convergence. Simulation results demonstrate that, compared to conventional autopilots, this scheme reduces lateral and longitudinal tracking errors in landing trajectories by over 50%, significantly enhancing the success rate and safety of autonomous landings.

随着低空经济的蓬勃发展,小型固定翼无人机凭借长续航与低噪声优势,已成为林业、消防、巡检等领域1-3的重要工具。无人机的可靠着陆回收是保障其重复使用与持续作业能力的关键,也是提升任务自主性的研究热点4-5。相较于巡航、盘旋等任务阶段,自主着陆过程涉及高空至低空、平飞至拉平等模态切换,通常依赖复杂飞控系统或人工经验操作6-7以确保安全。鉴于传统自驾仪在不同着陆场景及低空风扰下泛化能力有限,利用历史飞行数据库辅助8-10自主着陆成为提升着陆可靠性与安全性的有效途径。
相较于空中其他复杂的任务过程,自主着陆任务具有明确的阶段约束11-12和飞行数据可复用13的特点。自主着陆过程中无人机需在有限的时间与高度区间内完成不同阶段的位姿控制与模态切换14,即从着陆窗口起始状态出发,最终在目标落区触地并滑跑停止。若以空中段为观测对象,每次着陆试验的终止条件由时间和空间共同约束,而非单纯时间触发。此外,由于着陆窗口表征状态集合而非固定点,导致每次试验的初始状态亦存在变化。这种非严格一致性使得传统迭代学习策略15-17难以直接利用着陆过程的历史轨迹数据。
现有研究18-22针对非严格一致初始状态及不确定性条件下的迭代学习控制已开展较多探索。例如在不依赖精确模型的前提下,利用扩展状态观测器(ESO)处理系统非重复不确定性,设计数据驱动的控制器20,并融合多批次控制输入信息提升跟踪精度;面向虚拟管道内无人机系统,设计迭代学习控制器21,并实现期望轨迹跟踪;针对非重复性轨迹,设计数据驱动的补偿型学习控制器22。然而,部分方案控制器结构复杂,需依赖大量状态变量输入且参数整定工作繁重,难以满足低空经济应用中多架次无人机着陆对轻量化、易部署控制器的需求。
受此启发,本文提出一种基于历史轨迹驱动的迭代学习自主着陆控制方法。该方法面向已搭载成熟自驾仪的小型固定翼无人机,首先采集并筛选先前试验中的着陆轨迹数据;随后对历史轨迹进行规整处理,在保留其几何特征的同时实现时间长度对齐;最终依据规整后的历史轨迹数据设计迭代更新律,在迭代轴上实现对期望着陆轨迹的修正。该方法不仅有效突破了轨迹非一致性的约束,还能显著降低跟踪误差,从而提升整个着陆过程的安全裕度。本文主要贡献点如下所示:
1) 针对自主着陆场景,提出一种历史轨迹驱动的迭代学习方法,该方法既放宽了传统迭代学习对轨迹长度严格一致的约束要求,又容许存在有界的初始状态误差,并能够确保迭代过程的收敛性。
2) 所提方法保留了传统自驾仪的主体架构,兼具可靠性和安全性的同时,又仅需调节少量学习系数。迭代过程建立在外环期望轨迹的修正之上,既保障了飞行安全,又避免了传统方法中为达预期性能而频繁调节自驾仪复杂参数的繁琐过程。
3) 所提的历史轨迹驱动的学习策略,继承并改进自传统迭代学习的框架,实现对数据需求轻量化。通过挖掘和复用先前飞行架次中的历史轨迹信息,降低了对先验知识和数据积累的依赖,适用于计算资源受限、模型信息不全的小型固定翼无人机自主着陆场景。

1 动力学建模与表征

在自主着陆任务过程中,固定翼无人机起落架触地前可近似视为处于机翼水平无侧滑飞行状态,故其动力学模型可解耦为纵向与横侧向2个子系统,从而简化控制设计。同时,考虑到机载视觉引导着陆的实际场景约束,因此本文重点针对相对高度与横侧距这2个关键状态量的期望信号,设计历史轨迹驱动的迭代学习方法进行持续优化与修正,以提升着陆精度与安全冗余度。

1.1 动力学建模

无人机动力学模型是进行着陆算法设计的重要基础。如图1所示,建立无人机的机体坐标系 O B - x B y B z B,以及大地平面坐标系 O I - x I y I z I,其中 x I与跑道方向一致。假设在水平无侧滑飞行过程中,空速向量 V a的长度标量 V a为已知常数,那么根据Beard和Mclain23给出的建模方式,可以将纵向模型表征为
h ˙ = V a θ + d h θ ˙ = q q ˙ = - a θ , 1 θ ˙ - a θ , 2 θ + a θ , 3 δ e + d θ
式中: h为无人机相对于跑道的高度; θ为俯仰角,且在俯仰角 θ较小时, d h d θ为小扰动非线性项; q为俯仰角速率; δ e为升降舵; a θ , 1 a θ , 2 a θ , 3均为线性化常系数。
图 1 无人机坐标系

Fig.1 Coordinate systems of fixed-wing UAV

记系统状态为 x h = h , θ , q T,系统输出为 h,系统方程为 f h,可以将式(1)改写为
x ˙ h = f h x h + B h δ e h = C h x h
式中: B h C h为维数对应的输入和输出矩阵。
若将闭环系统视为整体,并引入高度期望信号的修正量 u I L C , h作为开环前馈控制,则得到纵向模型为
x ˙ h = f h ' x h + B h f h , c u I L C , h h = C h x h
式中: f h ' x h = f h x h + B h f h , c h d - h f h , c为线性比例-积分-微分(PID)控制器。
类似地,记无人机相对于跑道的横侧向距离为 y,则横侧向动力学方程为
y ˙ = V a ψ + d y ϕ , ψ ψ ˙ = g V a ϕ + d ψ ϕ ϕ ¨ = - a ϕ , 1 ϕ ˙ + a ϕ , 2 δ a + a ϕ , 3 δ r + d ϕ ϕ
式中: ϕ ψ分别为滚转角和偏航角,当滚转角 和偏航角较小时, d y d ψ d ϕ可视为小扰动非线性项; g为重力加速度常数; δ a为副翼指令; δ r为方向舵指令; a ϕ , 1 a ϕ , 2 a ϕ , 3均为线性化常系数。
记系统状态为 x y = y , ψ , ϕ T,系统方程为 f y,可以将式(4)改写为
x ˙ y = f y x y + f y , c δ a , δ r , y d - y y = C y x y
式中: C y为维数对应的输出矩阵; y d为横侧距的期望; f y , c为线性PID控制器。引入横侧距期望的修正量 u I L C , y作为新的开环系统控制输入,则得到横侧向模型为
x ˙ y = f y ' x y + f y , c u I L C , y y = C y x y
式中: f y ' x y = f h x y + f y , c y d - y

1.2 离散化表征

对纵向模型式(3)进行微分近似离散化24-25,并记离散化后的 f h ' x h f h , c u I L C , h分别为 f ¯ h ' x h f ¯ h , c u I L C , h,那么可以将纵向模型表征为离散化形式:
x h k t + 1 = f ¯ h ' x h k t + B h f ¯ h , c u I L C , h k t h k t = C h x h k t
式中: t为离散时刻;上标 k表示迭代次数。
同理,可得横侧向的离散化模型为
x y k t + 1 = f ¯ y ' x y k t + f ¯ y , c u I L C , y k t y k t = C y x y k t
式中: f ¯ y ' f ¯ y , c分别表示离散化后的 f y ' f y , c
假设1 在实际场景中,受系统带宽与饱和函数等限制,可假设系统模型式(7)式(8)中的 f ¯ h ' f ¯ y '满足Lipschitz条件,则有
f ¯ h ' x h , 1 - f ¯ h ' x h , 2 γ h x h , 1 - x h , 2 f ¯ y ' x y , 1 - f ¯ y ' x y , 2 γ y x y , 1 - x y , 2
式中, γ h , γ y > 0为Lipschitz常数。
假设2 假设开环输入 u I L C , h k u I L C , y k有界,受实际时长有限和速率限幅的影响,可假设式(7)式(8) f ¯ h , c , f ¯ y , c L范数满足仿射不等式
f ¯ h , c k P , h + N d k I , h + k D , h u I L C , h k f ¯ y , c k P , y + N d k I , y + k D , y u I L C , y k
式中: k P , h , k I , h , k D , h k P , y , k I , y , k D , y为等效控制器系数; N d为控制序列长度。
注1 迭代学习算法属于非基于模型(Model-based)的控制算法26,所设计的控制律中并不包含模型信息。本节省略了部分气动系数项和非线性耦合项,并应用上述假设,是为了便于简化冗长的收敛性和有界性分析过程。

2 学习算法设计与分析

本节提出一种适用于自主着陆场景的历史轨迹驱动的学习算法。首先,通过分析着陆任务中飞行轨迹存在的重复性特征,阐明利用历史轨迹进行学习的合理性与潜力。接着,针对自主着陆过程中非严格一致的轨迹跟踪问题,筛选并利用处于安全容许范围内的历史飞行轨迹,并应用非线性规整算法将其与初始期望轨迹进行匹配对齐,从而提取可靠的飞行经验;最后,设计基于历史轨迹信息的迭代学习更新律,并对其收敛性能进行分析。
设计的迭代学习控制架构如图2所示,记规整后的高度和横侧距为 h ˜ k t y ˜ k t;跟踪误差为 e ˜ h k t e ˜ y k t;迭代律 u I L C , h k u I L C , y k分别为高度与横侧距期望轨迹的修正量;记初始的高度期望和横侧距期望分别为 h d 0 t y d 0 t,则第 k + 1次试验的高度期望 h d k + 1 t y d k + 1 t横侧距期望为
图 2 自主着陆的迭代学习控制框架

Fig.2 Iterative learning control frame for auto-landing

h d k + 1 t = h d 0 t + u I L C , h k + 1 t y d k + 1 t = y d 0 t + u I L C , y k + 1 t
此外,采用图2所示的迭代架构不影响底层控制器的稳定性,且能够最大限度兼容现有系统,从而将迭代过程构建于成熟闭环控制系统之上,以确保飞行安全。

2.1 着陆任务重复性分析

固定翼无人机的着陆过程通常始于进场调整,以修正高度与航向角;当进入着陆窗口时启动着陆程序,包含高度保持、下滑、拉平及接地等阶段。若如图3所示分别记着陆窗口和期望落区为 𝒢 1 𝒢 2,那么无人机安全着陆的轨迹簇组成的集合都将处于一个虚拟管道 𝒯26,其中 𝒢 1为管道的起始截面, 𝒢 2为管道的结束截面。
图 3 自主着陆任务场景

Fig.3 Autonomous landing mission scenario

在受模型不确定性(如载荷变化)和外部干扰(如低空风扰)影响时,单一的着陆轨迹往往存在初始状态误差变化及轨迹长度非严格一致的特点。如图3所示,第 k次试验的轨迹长度为 N k + 1,而期望的高度和横侧距轨迹的序列长度为 N d + 1,二者长度可能是不一致的;实际着陆轨迹的初始点为 h k 0 , y k 0,也往往不同于期望轨迹的初始点 h d 0 0 , y d 0 0
因此,对于满足相同 𝒢 1 𝒢 2的自主着陆可视为重复性的过程。同时,在进行历史轨迹数据筛选时,容许着陆轨迹的初始状态和轨迹长度非严格一致,但需要飞行全程处于安全着陆虚拟管道 𝒯内。

2.2 历史轨迹对齐算法

本小节介绍基于动态时间规整的历史轨迹对齐方法19,其不仅能够规整轨迹长度,还能够有效保持轨迹在局部阶段的相似度。例如对于着陆轨迹,其不同阶段(如下滑、拉平)的轨迹特征存在显著差异,动态时间规整方法相较线性拉伸,能够更好地捕捉并匹配这些差异化的局部特征。对第 k次试验的高度序列和横侧距序列 h k t , y k t , t 0 , N k进行轨迹规整的目的,是使其能够尽可能按照高度和横侧距的期望轨迹 h d 0 t , y d 0 t , t 0 , N d进行伸缩。
以高度序列为例(横侧距序列的算法与之相同),首先建立路径矩阵 P N k + 1 × N d + 1,矩阵中处于第 i行,第 j列的元素 P i , j表示 h k i h d 0 j的曼哈顿距离。为了得到实际轨迹与期望轨迹间的映射关系,需要寻找规整路径 W k
W k = w 0 , w 1 , , w m , , w t k t k m a x N k , N d , N k + N d - 1
式中: w m = i , j为规整路径 W k的第 m个路径点。
寻找规整路径 W k的过程可视为动态规划(Dynamic programming)的问题,用 Σ i , j表示在 P i , j处的最小距离累积和,则有
Σ i , j = d i s y k i , y d j + m i n Σ i - 1 , j - 1 , Σ i - 1 , j , Σ i , j - 1
除此以外, W k需要满足如下所示条件与性质。
1) 边界条件(Boundary condition)路径 W k始终从 P矩阵的左下角 w 0 = 0,0出发,在右上角 w t k = N k , N d结束。
2) 连续性(Continuity)在位于当前路径点 w m - 1 = P i ' , j '时,下一路径点 w m = P i , j必须满足 i - i ' 1 j - j ' 1,以保证路径遍历连续时刻。
3) 单调性(Monotonicity)路径点 w m的下标只能不变或增加,以确保规整路径是随时间单调变化的。
为了保证规整路径 W k具有唯一性,还需满足以下约束条件:
4) 唯一性(Uniqueness)当路径存在多个前进方向时,尽量沿着 h d 0 j的方向前进,即当 Σ i + 1 , j = Σ i , j + 1时,总是选择 P i , j + 1作为下一路径点。
5) 消除条件(Eliminate condition)回溯时需要去掉多余点,以保证 h d 0 j中每一个元素在 h k i中有且仅有一个匹配结果。
在应用上述唯一性条件和消除条件后,最终得到的规整路径为
W ˜ k = w ˜ 0 , w ˜ 1 , , w ˜ m , , w ˜ N d m 0 , N d
式中: w ˜ 0 = w 0 , w ˜ N d = w N k。那么规整后的 h k t h d 0 t的映射关系可以表示为
h ˜ k 0 , h d 0 0 , , h ˜ k j , h d 0 j , , h ˜ k N d , h d 0 N d
综上所示,以高度序列为例(横侧距序列的算法流程与之类似,故不再重复),可以给出历史轨迹的规整算法流程如算法1所示。

算法1 高度序列规整算法

输入:

实际高度序列 h k t , t 0 , N k

期望高度序列 h d 0 t , t 0 , N d

输出:

规整高度序列 h ˜ k t , t t 0 , N d

1.

初始化路径矩阵 P和规整路径 W k

2.

for w m w 0 , w 1 , w t k

3.

   w m满足连续性和单调性

4.

   更新并计算最小距离累积和 Σ i , j

5.

end

6.

应用唯一性和消除条件 W k W ˜ k

7.

回溯并得到规整序列 h ˜ k t , t 0 , N d

2.3 迭代更新律设计

本小节给出利用规整后历史轨迹,设计相对高度和横侧距迭代更新律的方法。首先,定义第 k次试验的跟踪误差 e ˜ h k t e ˜ y k t
e ˜ h k t = h d 0 t - h ˜ k t e ˜ y k t = y d 0 t - y ˜ k t
式中: h d 0 t y d 0 t分别为期望的高度和横侧距; h ˜ k t y ˜ k t分别为规整后的实际高度和横侧距。
图4所示,控制设计的目标是设计迭代更新律 u I L C , h k + 1 u I L C , y k + 1修正式(11)中的实际期望 h d k + 1 y d k + 1,使得跟踪误差 e ˜ h k t e ˜ y k t满足
图 4 迭代学习控制架构

Fig.4 Schematic of iterative learning control

l i m k e ˜ h k t = 0 l i m k e ˜ y k t = 0      t 0,1 , N d
那么, u I L C , h k + 1 u I L C , y k + 1可以设计为如式(18)所示的P型迭代律形式
u I L C , h k + 1 t = u I L C , h k t + L h e ˜ h k t + 1 u I L C , y k + 1 t = u I L C , y k t + L y e ˜ y k t + 1
式中: L h L y分别为高度和横侧距迭代更新律的学习系数。

2.4 收敛性分析

为便于迭代收敛性的分析,先以高度迭代律为例,依次定义状态误差 Δ x h k t、迭代律误差 Δ u I L C , h k t以及规整状态误差 Δ x ˜ h k t写为
Δ x h k t x h , d 0 t - x ¯ h k t Δ u I L C , h k t u I L C , h , d t - u I L C , h k t Δ x ˜ h k t x h , d 0 t - x ˜ h k t
式中: x h , d 0 t为期望输出对应的期望状态; u I L C , h , d t为满足式(17)的期望迭代律; x ¯ h k t为经长度截断/增补处理后的第 k次试验系统状态为
x ¯ h k t =          x h k ( 0 ) , , x h k N d - 1 , x h k N d       N k > N d x h k t                                                             N k = N d x h k ( 0 ) , , x h k N k , , x h k N d = 0                                                                       N k < N d
那么,如下就有/无初始状态误差2种情况,分别给出如下2个定理及其对应的引理19,以分析在迭代律式(18)作用下的系统收敛性。
定理 1 对于式(7)使用迭代律式(18),若初始状态误差 Δ x ˜ h k 0 = 0 , k,则随着迭代次数的增加,最终能够保证规整后的轨迹跟踪误差收敛至0,即有
l i m k e ˜ h k t = 0      t 0,1 , N d
证明 由离散系统模型式(7)可知,在理想的迭代律 u I L C , h , d t作用下,有
x h , d 0 t + 1 = f ¯ h ' x h , d 0 t + B h f ¯ h , c u I L C , h , d t h d 0 t = C h x h , d 0 t
联立式(7)式(21)可得
e ˜ h k t + 1 = C h f ¯ h ' x d t - f ¯ h ' x ¯ h k t + C h B h f h , c Δ u I L C , h k t
在迭代律式(18)等号两边同时减去 u I L C , h , d t可得
Δ u I L C , h k + 1 t = Δ u I L C , h k t - L h e ˜ h k t + 1
联立式(22)式(23)则有
Δ u I L C , h k + 1 = Δ u I L C , h k - L h C h B h f h , c Δ u I L C , h k - L h C h f ¯ h ' x d - f ¯ h ' x ¯ h k
由假设1和假设2可知
f ¯ h ' x h , 1 - f ¯ h ' x h , 2 γ h x h , 1 - x h , 2 f ¯ h , c k P , h + N d k I , h + k D , h u I L C , h k
式(24)等号两边同时取 L范数可得
Δ u I L C , h k + 1 I - k P I D , h L h C h B h Δ u I L C , h k + γ h L h C h Δ x ˜ h k
式中: k P I D , h = k P , h + N d k I , h + k D , h。接着联立离散系统模型式(7)式(21)可得
Δ x ˜ h k t = f ¯ h ' x h , d 0 t - 1 - x ¯ h k t - 1 + B h f h , c Δ u I L C , h k t - 1
式(27)等号两边同时取 L范数则有
Δ x ˜ h k t γ h Δ x ˜ h k t - 1 + k P I D , h B h Δ u I L C , h k t - 1
式中: b h = k P I D , h B h
式(28)进行迭代递归可得到
Δ x ˜ h k t + 1 γ h t + 1 Δ x ˜ h k 0 + i = 0 t γ h t - i b h Δ u I L C , h k i
假设每次迭代的初值误差为0,即
Δ x ˜ h k 0 = x h , d 0 0 - x ˜ h k 0 = 0          k
那么,并将式(29)代入式(26)可得
Δ u I L C , h k + 1 t β 1 , h Δ u I L C , h k i + β 2 , h b h i = 0 t - 1 γ h t - i Δ u I L C , h k i
式中: β 1 , h = I - k P I D , h L h C h B h , β 2 , h = L h C h
选取 α h > m a x 1 , γ h,先在不等式(31)两边乘以 α h - λ h t,再求关于离散时刻 t的上确界,可得
s u p t α h - λ h t Δ u I L C , h k + 1 t β ¯ h s u p t α h - λ h t Δ u I L C , h k t
式中: β ¯ h = β 1 , h + b h β 2 , h 1 - α h - λ h - 1 N d α h λ h - 1 - 1
若可找到学习系数 L h和指数函数 α h - λ h t使得 β ¯ h < 1,则 Δ u I L C , h k + 1 t为压缩映射,故而有
l i m k Δ u I L C , h k t = 0
联立式(22)式(29)式(33)可知,随着迭代次数的增加,最终跟踪误差将收敛至0,即有
l i m k e ˜ h k t = 0
引理1 对于系统式(8)使用迭代律式(18),假设每次试验中横侧距不存在初始状态误差为
Δ x ˜ y k 0 = x y , d 0 t - x ˜ y k t = 0          k
那么随着迭代次数的增加,能够保证规整后的轨迹跟踪误差收敛至0,即有
l i m k e ˜ y k t = 0      t 0,1 , N d
定理2 对于系统式(7)使用迭代律式(18),当初始状态误差 Δ x ˜ h k 0 ω h , k有界时,存在有界的 ρ h,随着迭代次数的增加时,能够保证规整后的轨迹跟踪误差有界
l i m k s u p t e ˜ h k t ρ h ω h      t 0,1 , N d
证明 已知 Δ x ˜ h k 0 ω h , k,则结合由定理1中式(29)可知
Δ x ˜ h k t + 1 γ h t + 1 ω h + i = 0 t γ h t - i b h Δ u I L C , h k i
式(37)代入式(31)可得
Δ u I L C , h k + 1 t β 1 , h Δ u I L C , h k + 1 t + β 2 , h b h i = 0 t - 1 γ h t - i Δ u I L C , h k i + γ h t + 1 ω h L h C h
根据式(32),当 α h > m a x 1 , γ h时,同理可得
s u p t α h - λ h t Δ u I L C , h k + 1 t β ¯ h s u p t α h - λ h t Δ u I L C , h k t + ω h γ h α h
式(39)可知,若 k 时有 Δ u I L C , h k + 1 = Δ u I L C , h k,则需要满足
l i m k s u p t α h - λ h t Δ u I L C , h k + 1 t ω h γ h α h 1 - β ¯ h
联立式(37)式(40),并令 t = 0,可得
l i m k s u p t Δ x ˜ h k t α h t ω h + i = 0 t - 1 α h t - 1 - i ω h γ h b h 1 - β ¯ h = α h t + α h t - α h γ h b h α h - 1 1 - β ¯ h ω h
那么当 t 0 , N d时,若存在 ρ h满足
ρ h = C h s u p t α h t + α h t - α h γ h b h α h - 1 1 - β ¯ h
则能够使得跟踪误差满足
l i m k s u p t e ˜ h k t ρ h ω h      t 0,1 , N d
引理2 对于系统式(8)使用迭代律式(18),当初始状态误差 Δ x ˜ y k 0 ω y , k有界时,存在有界的 ρ y,随着迭代次数的增加,能够保证规整后的轨迹跟踪误差有界,即有
l i m k s u p t e ˜ y k t ρ y ω y      t 0,1 , N d

3 算法验证与结果分析

3.1 验证环境及参数

本小节依托在先前研究中搭建的高保真孪生仿真平台,验证所提迭代学习算法。高保真平台的动力学模块和地面站软件均来自商业无人机软件8。其中动力学模块包含基于计算流体动力学(CFD)的动力学模型,其支持的部分环境参数如表1所示。
表1 环境参数配置

Table 1 Configurations of environmental parameters

分类 允许设置参数
风扰 水平风向,水平风速,垂直风速,湍流均方根(RMS)
载荷 初始质量,质心偏移,电池容量,载荷类型
在迭代过程中,采用了相同的载荷配置,同时,考虑到小型固定翼无人机的质量较轻,易受风扰影响,故设置水平风速大小为0.514 m/s,风扰方向随机分布在以60°为间隔的方向上。同时设置无人机着陆窗口 𝒢 1中心的离地相对高度为50 m,相对跑道中线横侧距为1 m,无人机已经完成着陆任务的进近阶段,抵达着陆窗口后即转入下滑阶段。记第 k次实验,在初始时刻 t = 0时,相对高度和横侧距分别为 h k 0 y k 0。假设迭代过程中存在初始高度和横侧距误差,即满足均匀(Uniformly)分布
h d 0 0 - h k 0 = ω h U - σ h , σ h y d 0 0 - y k 0 = ω y U - σ y , σ y
式中: σ h σ y为均匀分布的边界。
此外,由于第 k次试验的实际输出轨迹序列长度为 N k + 1,为了定量刻画与检验序列长度变化对迭代过程的影响,可以将实际轨迹与期望轨迹的长度关系表征为
η = N d - N k N d + 1 × 100 %
式中:为了模拟迭代过程中轨迹长度偏差随跟踪误差的减小而减小, η在迭代前200次取 5 %,之后在前400次取 3 %,最终减小至 1 %直至仿真验证结束。
采用迭代律式(18),并设置学习系数为
L h = 0.008   5 L y = 0.004  
为了便于结果呈现,在进入迭代过程前首先进行100次试验,接着经过400次迭代试验,确保迭代过程收敛,最终继续进行100试验,以供进行学习前、学习中以及学习后的分析对比。

3.2 验证结果与分析

基于表1所示的环境与参数配置,开展仿真验证。图5对比了应用学习算法前后无人机的期望轨迹与实际轨迹。图中红色虚线、绿色虚线和蓝色实线分别代表学习前 k = 100、学习过程中 k = 300和学习后 k = 600的轨迹,跑道区域以不同颜色的阴影表示,其上的实线框区域为期望落区 𝒢 2。结果表明,经过学习修正,无人机的相对高度误差和横侧距误差均得到降低,并成功落入期望落区内。相对高度误差的降低不仅意味着轨迹跟踪精度的提升,更直接决定了无人机能否准确落入落区。同时,横侧距误差越小,表明无人机距离跑道中线越近,着陆效果越佳。
图 5 学习前、后无人机着陆轨迹

Fig.5 Landing trajectories before and after learning

学习算法的收敛性结果如图6图7所示。2个图中展示了不同初始误差和轨迹长度不确定性对收敛性的影响:圆点表示每次迭代试验的平均跟踪误差,不同颜色区分初始误差大小,背景灰度深浅表征长度不确定性程度。观察可知,在模拟了轨迹长度不确定性从 η = ± 5 %减小逐步至 η = ± 1 %的情况下,应用学习算法后,高度与横侧距误差均随迭代次数增加而收敛。例如,高度平均误差从0.47 m降至0.25 m,横侧距平均误差从0.16 m降至0.10 m,均降低了50%以上。此外,初始误差越大,平均误差越大,即反映在图中的散点的离散程度也越高。上述结果也与定理2和引理2的理论分析一致,表明在迭代更新律作用下,误差最终收敛,且收敛边界与初始误差的边界 ω h ω y正相关。
图 6 平均高度跟踪误差

Fig.6 Average height tracking error

图 7 平均横侧距跟踪误差

Fig.7 Average lateral distance tracking error

综合图5所示的无人机自主着陆轨迹,以及图6图7的收敛性分析结果可以看出,在图5模拟的自主着陆场景中,无人机成功经历了下滑、拉平和飘落等关键阶段,最终精准降落在跑道上。历史轨迹驱动策略的优势体现为,在单次着陆过程中难以实时调节或适应的误差,能够在迭代学习轴上得到有效降低。仿真验证结果与理论分析预期吻合,共同证实了该策略的有效性,即能够在存在随机干扰的动态环境中,通过学习积累重复着陆过程中的可重复经验(如可重复的误差、扰动等),并将这些提炼出的稳定知识应用于后续的着陆过程,从而提升着陆安全冗余度。
此外,由于本文所提出的学习框架兼具闭环反馈控制与开环前馈学习修正的双重机制。对于阵风等环境中不可重复的扰动成分,一方面,自驾仪既有的闭环反馈控制本身具备一定的鲁棒性,能够对其产生抑制效果;另一方面,所提的迭代学习框架具备一定的对非重复有界扰动的适应能力,从而增强着陆过程的安全冗余度。

4 结 论

针对固定翼无人机多架次自主着陆控制问题,提出一种基于历史轨迹数据驱动的迭代学习控制方法。该方法挖掘自主着陆历史轨迹的重复特性,以突破传统迭代学习对轨迹长度严格一致的约束,同时兼具对初始状态误差的鲁棒性。通过非线性轨迹规整方法保留历史轨迹模态特征并实现长度对齐,进而设计基于对齐轨迹的迭代更新律,并给出其收敛性理论分析。高保真仿真验证结果表明,所提方法有效降低了着陆轨迹跟踪误差,提升了多架次着陆场景的安全裕度。
未来研究将聚焦于将学习方法移植至机载飞控芯片,实现历史轨迹数据的自主采集与分析,并依托硬件平台开展实物飞行试验,推动方法的实用化与工程化。
[1]
张军, 陈磊, 高智杰, 等. 低空无人机技术研究现状与展望[J]. 中国工程科学202527(2): 73-85.

ZHANG J CHEN L GAO Z J, et al. Low-altitude unmanned aerial vehicle technology: Current status and prospects[J]. Strategic Study of CAE202527(2): 73-85 (in Chinese).

[2]
蒲钒, 陈志杰, 刘杨, 等. 数字低空融合运行空中交通管理技术[J]. 航空学报202546(11): 531331.

PU F CHEN Z J LIU Y, et al. Air traffic management technologies for digital low-altitude integrated operations[J]. Acta Aeronautica et Astronautica Sinica202546(11): 531331 (in Chinese).

[3]
ZHAO R LI Y GAO F, et al. Multi-agent constrained policy optimization for conflict-free management of connected autonomous vehicles at unsignalized intersections[J]. IEEE Transactions on Intelligent Transportation Systems202425(6): 5374-5388.

[4]
QI P Y ZHAO X W PALACIOS R. Autonomous landing control of highly flexible aircraft based on lidar preview in the presence of wind turbulence[J]. IEEE Transactions on Aerospace and Electronic Systems201955(5): 2543-2555.

[5]
LEE S LEE J LEE S, et al. Sliding mode guidance and control for UAV carrier landing[J]. IEEE Transactions on Aerospace and Electronic Systems201955(2): 951-966.

[6]
CHEN C TAN W Q QU X J, et al. A fuzzy human pilot model of longitudinal control for a carrier landing task[J]. IEEE Transactions on Aerospace and Electronic Systems201854(1): 453-466.

[7]
SADAT-HOSEINI H FAZELZADEH S A RASTI A, et al. Final approach and flare control of a flexible aircraft in crosswind landings[J]. Journal of Guidance, Control, and Dynamics201336(4): 946-957.

[8]
马国庆, 田秋扬, 朱波, 等. 孪生场景驱动的固定翼无人机进场自主着陆控制[J]. 控制理论与应用202441(9): 1664-1675.

MA G Q TIAN Q Y ZHU B, et al. Twin-scenario driven autolanding control for fixed-wing UAVs[J]. Control Theory & Applications202441(9): 1664-1675 (in Chinese).

[9]
FIGUEIRA J C BAZZOCCHI S WARWICK S, et al. Nonlinear aero-propulsive modeling for fixed-wing eVTOL UAV from flight test data[J]. Journal of Aircraft202462(2): 300-312.

[10]
CAO R LU K L LIU Y B. An interpretable data-driven learning approach for nonlinear aircraft systems with noisy interference[J]. IEEE Transactions on Aerospace and Electronic Systems202561(1): 182-194.

[11]
王宏伦, 裴云峰, 倪少波, 等. 飞行器无动力应急着陆域和着陆轨迹设计[J]. 航空学报201435(5): 1404-1415.

WANG H L PEI Y F NI S B, et al. Design of emergency landing region and landing trajectory for unpowered aircraft[J]. Acta Aeronautica et Astronautica Sinica201435(5): 1404-1415 (in Chinese).

[12]
PAN Z L PI Y J. Design of an automatic landing strategy for fixed-wing aircraft based on longitudinal and lateral collaborative hierarchical control[J]. Aerospace Science and Technology2025163: 110217.

[13]
IIGUNI Y AKIYOSHI H ADACHI N. An intelligent landing system based on a human skill model[J]. IEEE Transactions on Aerospace and Electronic Systems199834(3): 877-882.

[14]
DUAN H B CHEN L ZENG Z G. Automatic landing for carrier-based aircraft under the conditions of deck motion and carrier airwake disturbances[J]. IEEE Transactions on Aerospace and Electronic Systems202258(6): 5276-5291.

[15]
BRISTOW D A THARAYIL M ALLEYNE A G. A survey of iterative learning control[J]. IEEE Control Systems Magazine200626(3): 96-114.

[16]
LI X F HUANG D Q CHU B, et al. Robust iterative learning control for systems with norm-bounded uncertainties[J]. International Journal of Robust and Nonlinear Control201626(4): 697-718.

[17]
VAN DE WIJDEVEN J DONKERS T BOSGRA O. Iterative Learning Control for uncertain systems: Robust monotonic convergence analysis[J]. Automatica200945(10): 2383-2391.

[18]
LI X F XU J X HUANG D Q. An iterative learning control approach for linear systems with randomly varying trial lengths[J]. IEEE Transactions on Automatic Control201459(7): 1954-1960.

[19]
XIA J K ZHANG R Q LI Y N, et al. Iterative learning control based on dynamic time warping for a class of discrete-time nonlinear systems with varying trial lengths and terminus constraint[J]. International Journal of Robust and Nonlinear Control202333(5): 3146-3163.

[20]
郭晓临, 刘洋, 林娜, 等. 基于扩展状态观测器的量化无模型自适应迭代学习控制[J]. 控制理论与应用202542(2): 253-262.

GUO X L LIU Y LIN N, et al. Extended state observer-based quantitative model-free adaptive iterative learning control[J]. Control Theory & Applications202542(2): 253-262 (in Chinese).

[21]
LV S L MAO P D QUAN Q. Mean-field based time-optimal spatial iterative learning within a virtual tube[J]. IEEE Control Systems Letters20248: 2021-2026.

[22]
张凡, 孟德元, 惠宇. 面向超机动飞行的迭代学习控制研究综述[J]. 空天技术2022(6): 12-23, 66.

ZHANG F MENG D Y HUI Y. Review of iterative learning control for super-maneuver flight[J]. Aerospace Technology2022(6): 12-23, 66 (in Chinese).

[23]
BEARD R W MCLAIN T W. Small unmanned aircraft: Theory and practice[M]. Princeton: Princeton University Press, 2012: 95-118.

[24]
BALDI S SUN D P XIA X, et al. ArduPilot-based adaptive autopilot: architecture and software-in-the-loop experiments[J]. IEEE Transactions on Aerospace and Electronic Systems202258(5): 4473-4485.

[25]
SUN M X LI W WU L W. Dead-beat terminal sliding-mode control: A guaranteed attractiveness approach[J]. Automatica2021129: 109609.

[26]
LV S L GAO Y CHE J X, et al. Autonomous drone racing: time-optimal spatial iterative learning control within a virtual tube[C]∥2023 IEEE International Conference on Robotics and Automation (ICRA). Piscataway: IEEE Press, 2023: 3197-3203.

文章导航

/