技术栈

迷宫路线规划

我爱C编程
4 小时前
matlab·强化学习·sarsa·迷宫路线规划
基于SARSA强化学习的迷宫路线规划matlab仿真目录1.引言2.算法测试效果3.算法涉及理论知识概要4.MATLAB核心程序5.完整算法代码文件获得SARSA属于在线时序差分学习算法,是强化学习中值迭代类算法的核心代表,也是Q-Learning的孪生算法。SARSA是在线策略更新价值函数时,使用当前正在执行的策略产生的样本,探索与利用同步进行,更保守、更适合避免危险的场景(如迷宫中规避障碍)。对于迷宫路线规划任务,SARSA能在探索过程中主动规避障碍(悬崖/死路),规划出更安全、更稳健的可行路线,因此成为迷宫规划的优选算法之一。
我是有底线的