技术栈

增强学习

啊阿狸不会拉杆
21 天前
人工智能·python·学习·算法·机器学习·智能体·增强学习
《机器学习导论》第 18 章-增强学习目录18.1 引言18.2 单状态情况:K 臂老虎机问题核心概念完整代码实现(含可视化对比)代码解释运行效果
uncle_ll
2 年前
人工智能·机器学习·action·ppo·增强学习
机器学习:增强式学习Reinforcement learning如何控制你的action收集一些训练数据 但不一定是只有两种情况,不是二分类问题,可以采用不同的数字表示不同程度的期待
我是有底线的