%A 陈灿, 莫雳, 郑多, 程子恒, 林德福 %T 非对称机动能力多无人机智能协同攻防对抗 %0 Journal Article %D 2020 %J 航空学报 %R 10.7527/S1000-6893.2020.24152 %P 324152-324152 %V 41 %N 12 %U {https://hkxb.buaa.edu.cn/CN/abstract/article_18010.shtml} %8 %X 协同攻防对抗是未来军用无人机的重要作战场景。针对不同机动能力无人机群体间的攻防对抗问题,建立了多无人机协同攻防演化模型,基于多智能体强化学习理论,研究了多无人机协同攻防的自主决策方法,提出了基于执行-评判(Actor-Critic)算法的集中式评判和分布式执行的算法结构,保证算法稳定收敛的同时,提升执行效率。无人机的评判模块使用全局信息评价决策优劣引导策略学习,而执行时只需要依赖局部感知信息进行自主决策,提高了多机攻防对抗的效能。仿真结果表明,所提的多无人机强化学习方法具备较强的自进化属性,赋予了无人机一定智能,即稳定的自主学习能力,通过不断演化,能自主学习提升协同对抗的决策效能。