openpi使用过程中相关问题

1.loss无法下降

问题描述:

问题可以描述为,200条数据,进行LORA训练,前几步误差在30多,9万次训练后误差也大于0.5.

此时学习率lr如下:

复制代码
lr_schedule=_optimizer.CosineDecaySchedule(
            warmup_steps=5_000,           # 1000步预热,帮助稳定初始训练
            peak_lr=1e-5,                 # 峰值学习率(从默认值调低)
            decay_steps=300_000,          # 总衰减步数
            decay_lr=1e-7,                 # 最终学习率
        ),

排除学习率过大可能。

相似问题查找

经GITHUB相关问题查找,发现uu有遇到loss爆炸相关情况(loss 1000+),问题原因是归一化文件norm_stats.json中的action中的某些维度为0.导致std间相差倍数过大,或者某一维度的q0和q99过于接近

问题分析:

查看我自己的action的std发现第4,第6维度相较于其他几个维度明显过大(相差100倍)。

对原始数据进行分析,发现在action进行转换的时候,由于没有对弧度值限制在[0,2pai]内,导致最终的关节角相差了2pai的倍数,出现了关节角的跳变。处理方式:将差值限制在[0,2pai]

处理后结果

处理后发现第4第6维的std明显减小了,损失也恢复正常

相关推荐
梦梦代码精24 分钟前
从工程视角拆解 BuildingAI:一个企业级开源智能体平台的架构设计与实现
人工智能·gitee·开源·github
supericeice24 分钟前
复杂项目管理如何用好大模型:RAG、知识图谱与AI编排的落地框架
人工智能·知识图谱
AI机器学习算法6 小时前
深度学习模型演进:6个里程碑式CNN架构
人工智能·深度学习·cnn·大模型·ai学习路线
Ztopcloud极拓云视角6 小时前
从 OpenRouter 数据看中美 AI 调用量反转:统计口径、模型路由与多云应对方案
人工智能·阿里云·大模型·token·中美ai
AI医影跨模态组学6 小时前
如何将深度学习MTSR与膀胱癌ITGB8/TGF-β/WNT机制建立关联,并进一步解释其与患者预后及肿瘤侵袭、免疫抑制的生物学联系
人工智能·深度学习·论文·医学影像
搬砖的前端6 小时前
AI编辑器开源主模型搭配本地模型辅助对标GPT5.2/GPT5.4/Claude4.6(前端开发专属)
人工智能·开源·claude·mcp·trae·qwen3.6·ops4.6
Python私教7 小时前
Hermes Agent 安全加固与生态扩展:2026-04-23 更新解析
人工智能
饼干哥哥7 小时前
Kimi K2.6 干成了Claude Design国产版,一句话生成电影级的动态品牌网站
人工智能
肖有米XTKF86467 小时前
带货者精品优选模式系统的平台解析
人工智能·信息可视化·团队开发·csdn开发云
天天进步20157 小时前
打破沙盒限制:OpenWork 如何通过权限模型实现安全的系统级调用?
人工智能·安全