llm使用 AgentScope-Tuner 通过 RL 训练 FrozenLake 智能体

agentscope-samples/tuner/frozen_lake at main · agentscope-ai/agentscope-samples --- agentscope-samples/tuner/frozen_lake at main · agentscope-ai/agentscope-samples

  • At least 2 NVIDIA GPUs with CUDA 12.8 or newer

    至少需要 2 块 NVIDIA GPU,支持 CUDA 12.8 或更高版本

An example of agent output is given below:

下面给出一个代理输出的示例:

复制代码
From the current observation, let's analyze the situation. The player (P) is at: (4, 0), and the goal (G) is at: (2, 3). There is also a hole (O) at (4, 4). Given this, I can move towards the goal without worrying about slippery tiles right now.

The shortest path from P to G involves moving left (4 steps) followed by moving down (1 step), since going directly would bypass the hole or move us further from the goal. Let's move left first.

Let's take the action ```Left```.
相关推荐
F1FJJ12 小时前
AI 编程实战对比:Claude Code vs Trae
图像处理·人工智能·ai作画·golang·visual studio code
LaughingZhu12 小时前
Product Hunt 每日热榜 | 2026-03-30
大数据·数据库·人工智能·经验分享·搜索引擎
larance12 小时前
[菜鸟教程] 机器学习教程第一课
人工智能·机器学习
li三河13 小时前
paddleocr识别和推理,并用MNN进行推理
人工智能·深度学习·mnn
yichudu13 小时前
AI 编程发展与工具介绍
人工智能
bryant_meng13 小时前
【AI】《Explainable Machine Learning》(2)
人工智能·深度学习·机器学习·计算机视觉·explanation
witAI13 小时前
**AI仿真人剧技术解析2025,专业评估与适配指南**
人工智能·python
企业架构师老王13 小时前
OpenClaw引爆赛博大屠杀:企业数字化转型中AI Agent的风险边界与实在Agent落地指南
人工智能·ai
卡梅德生物小喇叭13 小时前
卡梅德生物技术快报|基于 CHO 细胞的百日咳毒素中和抗体检测方法构建与验证
人工智能·经验分享·elementui·微信公众平台·facebook
梦想很大很大13 小时前
从 0 到 1 实现 AI Agent(01):LLM 对话 + 本地 Tool 调用
人工智能·llm·agent