今天看了一篇无人机的避障设计的论文,是在3D环境下的其中包含以下部分:
1、DVO模糊控制与速度避障
2、ADDPG P_DDPG
动态障碍物+DVO自主避障
路径跟踪P_DDPG+动态障碍物DVO=路径跟踪
3、路径跟踪约束 避障约束
速度避障策略 实时调整速度、避障时间窗口应对环境变化 模糊控制器 变量
VO障碍物---避障时间窗口(约束)----速度障碍法避障------模糊控制速度障碍物----时间窗口隶属度----去模糊化
4、MDP建模
状态空间s
速度a
状态转移奖励函数 :避障、任务完成、碰撞、路径跟踪
5、DDPG :①无障碍物 ②有动态障碍物
6、仿真:
①无障碍物 DDPG P_DDPG(加入归一化的DDPG)
后者更收敛、更稳定、路径偏移更小
②有动态障碍物DDPG ADDPG
后者奖励更高
③DVO/VO/DO的对比
DVO更稳定、位移量低、碰撞率低
笔笔都有天意,生命没有败笔。