机器学习28:增强式学习(Deep Reinforcement Learn)③本周的学习重点是增强式学习(Reinforcement Learning, RL)中的Actor-Critic方法。主要深入讲解Actor-Critic框架的核心原理、优势函数的计算、Critic的价值估计方式,以及如何结合Actor和Critic来提升策略学习的稳定性和效率。并且重点围绕Actor-Critic的核心内容展开总结,包括价值函数估计(Monte Carlo vs. Temporal Difference)、优势函数的定义与作用、Actor-Critic的整体框架、训练细节,以及相关扩展如奖