技术栈
learning_based
Robot_Nav
2 天前
rl
·
learning_based
·
mppi
RL-Driven MPPI:基于离线策略加速在线控制律计算的模型预测路径积分控制
最优控制方法是众多复杂控制与决策任务的核心技术,其目标是通过求解由预设代价函数和系统动力学定义的优化问题,找到最优控制律序列。传统最优控制方法,如线性二次调节器(LQR),在处理线性系统时表现优异,但面对非线性系统时存在明显局限。
Robot_Nav
20 天前
开发语言
·
深度强化学习
·
learning_based
基于深度强化学习的自主导航与避障策略研究
深度强化学习(DRL)在自主导航与避障领域展现出强大潜力,其中近端策略优化(PPO)和双延迟深度确定性策略梯度(TD3)是两种主流算法。通过结合这两种算法的优势,可以设计出高效、稳定的移动机器人控制策略。
我是有底线的