2022 OE-基于Q学习和数据驱动的无人船舶航向控制和轨迹跟踪 PYTHON [1][2][...2022 OE-基于Q学习和数据驱动的无人船舶航向控制和轨迹跟踪 PYTHON [1][2][3] 主要基于深度 Q 网络 (DQN) 的强化学习算法用于路径跟踪和平静水面和波浪中船舶的航向控制。 船舶的舵作用是根据DQN模型。 空间位置、线速度、偏航角速度、航向误差和交叉航迹误差代表状态空间,一组舵角代表 DQN 模型的动作空间。 状态空间变量在连续空间中,动作空间在离散空间中。 方法用于探索。 奖励函数被建模,使得代理将尝试减少交叉航迹误差和航向误差。 使用 3DoF 机动模型表示,该模型包括水动力、