基于SAC的低轨卫星上行鲁棒传输优化方法

doi:10.7527/S1000-6893.2026.33400

本期目录 | 过刊浏览 | 高级检索

前一篇 | 后一篇

基于SAC的低轨卫星上行鲁棒传输优化方法

刘畅¹,马彪¹,杨柳²,许拔³,欧阳键¹

1. 南京邮电大学
2. 航天工程大学电子与光学工程系
3. 国防科技大学

收稿日期:2026-01-20 修回日期:2026-05-03 出版日期:2026-05-08 发布日期:2026-05-08
通讯作者: 欧阳键
基金资助:
智能化航天测运控教育部重点实验室基金资助项目;南京信息工程大学复杂环境智能保障技术教育部重点实验室开放基金资助课题

SAC-Based robust uplink transmission optimization method for LEO satellites

Received:2026-01-20 Revised:2026-05-03 Online:2026-05-08 Published:2026-05-08
Contact: Jian Ouyang

摘要/Abstract

摘要： 针对低地球轨道（LEO）卫星上行通信环境高动态导致信道误差统计先验信息获取难度大的问题，提出一种上行鲁棒传输优化方法。该方法以总发射功率最小化为目标，以用户服务质量（QoS）和最大发射功率为约束，构建用户角度信息不准确场景下的上行鲁棒传输优化问题。通过将此非凸问题建模为马尔可夫决策过程，设计一种基于柔性演员-评论家（SAC）的上行多用户鲁棒波束成形（BF）与功率控制算法，使卫星无需依赖误差统计先验信息，通过与环境交互自主学习并调整波束成形权矢量与功率控制策略。仿真结果表明，相比于非鲁棒方案和近端策略优化基准方案，所提方法在不同误差场景下所需发射功率能分别平均节省59%和24%，表明所提方法的鲁棒性和优越性。

关键词: 低地球轨道卫星, 上行链路传输, 非完美信道状态信息, 鲁棒波束成形, 功率控制, 深度强化学习

Abstract: To address the challenge of obtaining prior statistical information on channel errors caused by the highly dynamic environment of Low Earth Orbit (LEO) satellite uplink communications, this paper proposes a robust uplink transmission optimization method. Aiming to minimize the total transmit power subject to User Quality of Service (QoS) and maximum transmit power constraints, a robust transmission optimization problem is formulated for scenarios characterized by inaccurate user angle information. By modeling this non-convex problem as a Markov Decision Process (MDP), a multi-user robust beamforming (BF) and power control algorithm based on Soft Actor-Critic (SAC) is designed. This approach enables the satellite to autonomously learn and adjust beamforming weight vectors and power control strategies through interaction with the environment, without relying on prior information regarding error statistics. Simulation results demonstrate that, compared with the non-robust scheme and the Proximal Policy Optimization (PPO) baseline scheme, the proposed method reduces the required transmit power by an average of 59% and 24%, respectively, under different error scenarios, thereby verifying the robustness and superiority of the proposed method.

Key words: Low Earth Orbit satellite, uplink transmission, imperfect channel state information, robust beamforming, power control, deep reinforcement learning

中图分类号:

V474.2+1

刘畅马彪杨柳许拔欧阳键. 基于SAC的低轨卫星上行鲁棒传输优化方法[J]. 航空学报, doi: 10.7527/S1000-6893.2026.33400.

E-mail：hkxb@buaa.edu.cn

关于我们

期刊社服务

专业学科

封面文章

友情链接

主管单位：中国科学技术协会主办单位：中国航空学会北京航空航天大学

[1]	高思华, 赵炳阳, 李建伏. 基于时间窗约束的无人机完整性数据采集路径规划算法[J]. 航空学报, 2026, 47(6): 332451-332451.
[2]	张磊, 田灿, 文方青, 张清河, 刘含. 面向移动边缘网络的多目标进化深度确定性策略梯度算法[J]. 航空学报, 2026, 47(3): 631880-631880.
[3]	万开方, 吴志林, 武韫晖, 强皓植, 吴艺博, 李波. 拒止环境下基于深度强化学习的多无人机协同定位[J]. 航空学报, 2025, 46(8): 331024-331024.
[4]	姜凌峰, 李新凯, 张海, 李涵玮, 张宏立. 基于改进TD3算法的无人机动态环境无地图导航[J]. 航空学报, 2025, 46(8): 331035-331035.
[5]	杨敏, 刘关俊, 周子渊. 基于安全强化学习的月球着陆器控制[J]. 航空学报, 2025, 46(3): 630553-630553.
[6]	谢启超, 曹承钰, 赵逸云, 李繁飙. 基于深度强化学习调参的制导控制一体化方法[J]. 航空学报, 2025, 46(24): 632345-632345.
[7]	王辰, 魏才盛, 殷泽阳, 靳锴, 李星辰. 考虑信道资源约束的多无人机航迹与通信策略协同规划[J]. 航空学报, 2025, 46(18): 331837-331837.
[8]	王昱, 谢志鹏, 田永健, 孟光磊. 虚拟结构引领强化学习分布式无人机编队控制[J]. 航空学报, 2025, 46(15): 331354-331354.
[9]	陈伟, 李璐璐, 陈董, 张少辉, 李亚飞, 王可, 靳远远, 徐明亮. 差异化保障需求驱动的舰载机多机协同决策方法[J]. 航空学报, 2025, 46(13): 531274-531274.
[10]	陈旭东, 陈琦琦, 罗祎喆, 王佳宝, 徐明亮. 异构舰载机舰面保障作业动态并行调度[J]. 航空学报, 2025, 46(13): 531329-531329.
[11]	王政, 王华, 崔可可, 李超超, 刘俊楠, 徐明亮. 局部引导强化学习的舰载机自主调运方法[J]. 航空学报, 2025, 46(13): 531333-531333.
[12]	凌文辉, 牟春晖, 聂聆聪, 杜宪, 孙希明. 基于改进DDPG的宽速域几何可调燃烧室压力分布控制[J]. 航空学报, 2025, 46(12): 131092-131092.
[13]	余子杰, 郑征, 李清东, 郭林, 任素萍, 郭健. 基于深度强化学习的太阳能无人机航迹规划[J]. 航空学报, 2025, 46(12): 331420-331420.
[14]	高树一, 林德福, 郑多, 徐骋. 考虑拦截器探测能力限制的飞行器智能机动突防制导策略[J]. 航空学报, 2025, 46(10): 331304-331304.
[15]	张鸿林, 罗建军, 马卫华. 基于机器学习的航天器规避目标威胁博弈决策[J]. 航空学报, 2024, 45(8): 329136-329136.

基于SAC的低轨卫星上行鲁棒传输优化方法

SAC-Based robust uplink transmission optimization method for LEO satellites

PDF (PC)

可视化

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价