8. 机器人模型训练与评估(具身智能机器人套件)

1. 训练

使用python lerobot/scripts/train.py可以进行机器人控制模型训练,一般需要几个小时,可以在outputs/train/act_lekiwi_test/checkpoints查看锚点数据,下面为一组示例参数:

bash 复制代码
python lerobot/scripts/train.py \
  --dataset.repo_id=${HF_USER}/lekiwi_test \
  --policy.type=act \
  --output_dir=outputs/train/act_lekiwi_test \
  --job_name=act_lekiwi_test \
  --device=cuda \
  --wandb.enable=true
  • 数据集参数:--dataset.repo_id=${HF_USER}/lekiwi_test
  • 机器人配置:policy.type=act表示从 configuration_act.py 加载配置,数据集中记录了机器人的电机状态、电机动作和摄像头的数量。
  • device=cuda表示在 Nvidia GPU 上训练,使用device=mps来在 Apple 芯片上训练。
  • wandb.enable=true表示使用wandb.ai来可视化训练图,使用之前要使用wandb login先登录,这是官网地址

2. 评估训练模型

评估跟录制数据集是同一个方法(lerobot/scripts/control_robot.py),不过增加了锚点作为输入,下面命令可以用来录制10个评估数据集。

bash 复制代码
python lerobot/scripts/control_robot.py \
  --robot.type=lekiwi \
  --control.type=record \
  --control.fps=30 \
  --control.single_task="找到红色块,并捡起来" \
  --control.repo_id=${HF_USER}/eval_act_lekiwi_test \
  --control.tags='["tutorial"]' \
  --control.warmup_time_s=5 \
  --control.episode_time_s=30 \
  --control.reset_time_s=30 \
  --control.num_episodes=10 \
  --control.push_to_hub=true \
  --control.policy.path=outputs/train/act_lekiwi_test/checkpoints/last/pretrained_model

它与之前用于录制训练数据集的命令很像,有两点不同变化:

  • 增加参数 control.policy.path 表示策略锚点的路径(--outputs/train/eval_act_lekiwi_test/checkpoints/last/pretrained_model)。如果您将模型锚点上传到hf,还可以使用模型库(${HF_USER}/act_lekiwi_test )。
  • 数据集的名称以eval开头,表示正在进行推理(${HF_USER}/eval_act_lekiwi_test )。

具身开源套件部分课程如下,欢迎联系合作采购(全套开源)

  1. 树莓派上配置机器人环境
  2. 电脑主机上配置机器人环境
  3. 机器人硬件组装
  4. 基于硬件更新软件配置
  5. 机器人标定
  6. 机器人远程遥控
  7. 机器人数据集记录
  8. 机器人模型训练与评估
相关推荐
互联网江湖21 小时前
携程当学胖东来
人工智能
陌殇殇21 小时前
001 Spring AI Alibaba框架整合百炼大模型平台 — 快速入门
人工智能·spring boot·ai
Proxy_ZZ021 小时前
用Matlab绘制BER曲线对比SPA与Min-Sum性能
人工智能·算法·机器学习
黎阳之光21 小时前
黎阳之光:以视频孪生领跑全球,赋能数字孪生水利智能监测新征程
大数据·人工智能·算法·安全·数字孪生
宇擎智脑科技21 小时前
基于 SAM3 + FastAPI 搭建智能图像标注工具实战
人工智能·计算机视觉
F_U_N_1 天前
效率提升80%:AI全流程研发真实项目落地复盘
人工智能·ai编程
月诸清酒1 天前
24-260409 AI 科技日报 (Gemma 4发布一周下载破千万,开源模型生态加速演进)
人工智能·开源
2501_933329551 天前
技术架构深度解析:Infoseek舆情监测系统的全链路设计与GEO时代的技术实践
开发语言·人工智能·分布式·架构
X journey1 天前
机器学习进阶(16):如何防止过拟合
人工智能·机器学习
AI_Claude_code1 天前
ZLibrary访问困境方案四:利用Cloudflare Workers等边缘计算实现访问
javascript·人工智能·爬虫·python·网络爬虫·边缘计算·爬山算法