1 问题描述
2 无人机智能避让模型建立
2.1 任务概述与控制设计
2.2 基于PPO的智能避让算法
2.3 评估指标和场景模型
2.3.1 评估指标
2.3.2 评估场景模型
3 基于贝叶斯优化的智能避让系统定量评估算法
3.1 贝叶斯优化
3.2 获取函数设计
3.3 训练流程
| |
|---|
| 1.初始化输入空间;输入输出集合 ;高斯过程 ;分布函数 。 |
| 2. |
| 3. |
| 4. |
| 5. |
| 6. |
| 7. |
| 8. |
| 9. |
| 10. |
4 安全任务
4.1 RL模型安全验证
4.1.1 证伪
4.1.2 最可能失效分析
4.1.3 失效概率估计
4.2 智能避让系统安全评估流程
表1 包含RL模型智能避让系统安全性评估流程Table 1 Safety assessment process of intelligent collision avoidance system with RL models |
| 步骤 | 活动 |
|---|---|
| 步骤1:功能危害评估 | 在运行概念下进行系统功能危害分析(本文重点关注含RL模型错误“机动”功能危害) |
| 步骤2:初步系统安全性评估 | 1.定义安全性目标 2.定义初步系统架构以满足安全性目标 3.衍生包括独立需求的安全性需求,满足目标和支持架构 4.定义和确认假设 5.分配研制保证水平(DAL) 6.基于贝叶斯优化,通过不确定性探索、边界细化和失效区域采样函数,训练高斯代理模型 7.在冲突距离和冲突角度两维输入空间X和分布函数 的场景下对RL模型进行失效概率估计与分析 8.衍生需求满足性的RL模型运行域(即安全边界) 9.执行RL单元失效模式影响分析 |
| 步骤3:系统安全性评估 | 执行最终的安全性评估 |
5 实验与分析
5.1 实验设置
5.2 训练过程与结果
5.3 安全性评估
5.3.1 安全验证任务
表2 4种评估方法用于安全验证任务Table 2 Four evaluation methods for safety verification tasks |
| 评估方法 | |||||
|---|---|---|---|---|---|
| 真实系统 | 20.8% | (0.867 93,1.895 79) | 1.496×10-3 | 8.410 72×10-5 | |
| 代理模型 | 50.2% | (0.861 72,1.895 79) | 1.396×10-3 | 8.407 26×10-5 | 4.12×10-4 |
| 均匀采样 | 21.7% | (0.838 70,1.935 48) | 9.543×10-4 | 8.055 44×10-5 | 4.22×10-2 |
| 蒙特卡洛 | 21.6% | (0.827 56,1.918 87) | 9.687×10-4 | 8.619 19×10-5 | 2.48×10-2 |
表3 3种获取函数的消融实验用于安全验证任务Table 3 Ablation study of three acquisition functions for safety validation task |
| 获取函数组合 | |||||
|---|---|---|---|---|---|
| 不确定性探索 | 21.6% | (0.833 67,1.907 82) | 1.030×10-3 | 8.522 94×10-5 | 1.33×10-2 |
| 边界细化 | 35.5% | (0.861 72,1.899 80) | 1.368×10-3 | 8.628 98×10-5 | 2.59×10-2 |
| 失效区域采样 | 89.2% | (0.436 88,1.330 66) | 3.352×10-4 | 5.827 44×10-5 | 3.07×10-1 |
| 不确定性探索、边界细化 | 34.6% | (0.857 72,1.895 79) | 1.366×10-3 | 8.485 22×10-5 | 8.86×10-3 |
| 不确定性探索、失效区域采样 | 49.3% | (0.821 64,1.887 77) | 1.094×10-3 | 7.749 55×10-5 | 7.86×10-2 |
| 边界细化、失效区域采样 | 52.8% | (0.857 71,1.895 79) | 1.361×10-3 | 8.453 47×10-5 | 5.08×10-3 |
| 代理模型 | 50.2% | (0.861 72,1.895 79) | 1.396×10-3 | 8.407 26×10-5 | 4.12×10-4 |
表4 扩展实验安全验证任务对比Table 4 Comparison of safety verification tasks in extended experiments |
| 评估方法 | ||||
|---|---|---|---|---|
| 均匀采样 | 21.4% | (0.915,1.932,1.254) | 1.665×10-3 | 8.051 64×10-5 |
| 代理模型 | 47.2% | (0.929,1.939,1.293) | 1.331×10-3 | 7.714 31×10-5 |
5.3.2 安全边界确定
5.3.3 系统安全性评估
表5 故障树底层事件失效概率Table 5 Failure data of basic events in FTA |
| 编号 | 故障树底事件 | 失效概率/每次飞行 |
|---|---|---|
| 1 | ADS-B系统功能失效 | 1.0×10-5 |
| 2 | GPS系统数据丢失 | 2.0×10-4 |
| 3 | GPS系统信息误导 | 3.0×10-5 |
| 4 | RL模块提供错误“机动” | 1.0×10-5 |
| 5 | RL模块硬件失效 | 3.5×10-6 |
| 6 | 飞行控制功能失效 | 1.0×10-6 |
| 7 | 无人机位于相撞航线 |

