多阶段协同决策的舰载机保障作业动态调度方法（稿号：25-32474）

doi:10.7527/S1000-6893.2025.33077

本期目录 | 过刊浏览 | 高级检索

前一篇 | 后一篇

多阶段协同决策的舰载机保障作业动态调度方法（稿号：25-32474）

贺硕¹,刘佳林¹,沈奥¹,朱赛赛¹,靳远远²,李璐璐²,李亚飞²,徐明亮²

1. 郑州大学计算机与人工智能学院
2. 郑州大学

收稿日期:2025-11-11 修回日期:2025-12-13 出版日期:2025-12-15 发布日期:2025-12-15
通讯作者: 徐明亮
基金资助:
国家自然科学基金

A Multi-stage Collaborative Decision-making Approach for Dynamic Scheduling of Carrier-based Aircraft Support Operations （稿号：25-32474）

Received:2025-11-11 Revised:2025-12-13 Online:2025-12-15 Published:2025-12-15
Contact: Ming-Liang XU

摘要/Abstract

摘要： 针对现有舰载机保障作业调度研究中存在的子任务耦合关系挖掘不足以及动态适应性受限等问题，本文研究了具有多阶段依赖关系的舰载机保障作业调度问题。首先，通过将保障站位分配与舰载机保障顺序决策建模为多智能体马尔科夫决策过程，建立了舰载机保障作业调度子任务间序贯耦合关系的数学表征；然后，提出了基于独立深度Q网络的多智能体协同决策框架，该框架采用了分布式训练-执行机制，具体包括保障站位分配模块、舰载机保障顺序决策模块和多智能体协同调度模块；进一步地，基于该框架提出了基于多阶段顺序决策机制的舰载机保障作业协同调度算法对模型进行求解；最后，仿真实验结果表明，所提算法收敛后的平均奖励值相较于Dueling DQN和N-step DQN方法分别提升27.08%、14.19%，奖励标准差相较于Dueling DQN和N-step DQN方法分别提升56.44%、45.43%，验证了多阶段协同决策机制在解决复杂调度问题中的有效性。

关键词: 舰载机, 深度强化学习, 多阶段, 调度优化, 资源分配

Abstract: To address the insufficient exploration of subtask coupling relationships and limited dynamic adaptability in existing carrier-based aircraft support operation scheduling research, this study investigates a multi-stage scheduling problem for carrier-based aircraft support operations. Firstly, by modeling both support station allocation and aircraft servicing sequence determination as a multi-agent Markov decision process, we establish a mathematical characterization of the sequential coupling relationships between subtasks in support operation scheduling. Subsequently, an Independent Deep Q-network-based multi-agent collaborative decision-making framework is proposed, incorporating a distributed training-execution mechanism that specially includes a support station allocation module, an aircraft servicing sequence decision module, and a multi-agent collaborative scheduling module. Furthermore, a collaborative scheduling algorithm based on the multi-stage sequential decision-making mechanism is developed to solve the model. Finally, simulation results demonstrate that the proposed algorithm yields a 27.08% and 14.19% improvement in average reward, and a 56.44% and 45.43% improvement in reward standard deviation, over the Dueling DQN and N-step DQN methods, respectively, verifying the effectiveness of the multi-stage collaborative decision-making mechanism in addressing complex scheduling problems.

Key words: carrier-based aircraft, deep reinforcement learning, multi-stage, scheduling optimization, resource allocation

中图分类号:

贺硕刘佳林沈奥朱赛赛靳远远李璐璐李亚飞徐明亮. 多阶段协同决策的舰载机保障作业动态调度方法（稿号：25-32474）[J]. 航空学报, doi: 10.7527/S1000-6893.2025.33077.

E-mail：hkxb@buaa.edu.cn

关于我们

期刊社服务

专业学科

封面文章

友情链接

主管单位：中国科学技术协会主办单位：中国航空学会北京航空航天大学

[1]	万开方, 吴志林, 武韫晖, 强皓植, 吴艺博, 李波. 拒止环境下基于深度强化学习的多无人机协同定位[J]. 航空学报, 2025, 46(8): 331024-331024.
[2]	姜凌峰, 李新凯, 张海, 李涵玮, 张宏立. 基于改进TD3算法的无人机动态环境无地图导航[J]. 航空学报, 2025, 46(8): 331035-331035.
[3]	杨敏, 刘关俊, 周子渊. 基于安全强化学习的月球着陆器控制[J]. 航空学报, 2025, 46(3): 630553-630553.
[4]	王辰, 魏才盛, 殷泽阳, 靳锴, 李星辰. 考虑信道资源约束的多无人机航迹与通信策略协同规划[J]. 航空学报, 2025, 46(18): 331837-331837.
[5]	罗祎喆, 张辉, 余新得, 金钊, 冯朔, 石育澄, 徐明亮. 面向舰载机多波次弹药保障任务的分层动态调度[J]. 航空学报, 2025, 46(18): 331945-331945.
[6]	王昱, 谢志鹏, 田永健, 孟光磊. 虚拟结构引领强化学习分布式无人机编队控制[J]. 航空学报, 2025, 46(15): 331354-331354.
[7]	吕晓晨, 史静平, 吕永玺, 李耕农. 传感器失效下的魔毯着舰气流角重构算法[J]. 航空学报, 2025, 46(13): 531159-531159.
[8]	郭放, 韩维, 刘玉杰, 刘洁, 苏析超, 程亮亮. 基于可变作业流程的舰载机机务勤务保障作业调度[J]. 航空学报, 2025, 46(13): 531195-531195.
[9]	陈伟, 李璐璐, 陈董, 张少辉, 李亚飞, 王可, 靳远远, 徐明亮. 差异化保障需求驱动的舰载机多机协同决策方法[J]. 航空学报, 2025, 46(13): 531274-531274.
[10]	陈旭东, 陈琦琦, 罗祎喆, 王佳宝, 徐明亮. 异构舰载机舰面保障作业动态并行调度[J]. 航空学报, 2025, 46(13): 531329-531329.
[11]	王政, 王华, 崔可可, 李超超, 刘俊楠, 徐明亮. 局部引导强化学习的舰载机自主调运方法[J]. 航空学报, 2025, 46(13): 531333-531333.
[12]	许鑫泽, 洪冠新, 杜亮, 刘刚. 复杂环境下舰载机人工进近着舰模型[J]. 航空学报, 2025, 46(13): 531802-531802.
[13]	王家兴, 陈浩, 邵铮, 张杨. 基于航迹角指令的直接升力着舰控制方法[J]. 航空学报, 2025, 46(13): 532162-532162.
[14]	张志冰, 甄子洋. 固定翼舰载有人/无人机着舰引导控制研究进展[J]. 航空学报, 2025, 46(13): 532336-532336.
[15]	凌文辉, 牟春晖, 聂聆聪, 杜宪, 孙希明. 基于改进DDPG的宽速域几何可调燃烧室压力分布控制[J]. 航空学报, 2025, 46(12): 131092-131092.

多阶段协同决策的舰载机保障作业动态调度方法（稿号：25-32474）

A Multi-stage Collaborative Decision-making Approach for Dynamic Scheduling of Carrier-based Aircraft Support Operations （稿号：25-32474）

PDF (PC)

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价