技术栈

书生浦语-模型微调

SatVision炼金士2024-02-17 19:16

大语言模型微调

指令微调的流程



LoRA(旁路分支微调)



Xtuner微调框架



微调训练


作业

微调作业需要多训练几个epoch,这里训练了16个epoch

上一篇:C++ 50道面试题
下一篇:C++特殊类设计
相关推荐
曲幽
1 天前
FastAPI + PostgreSQL 实战:从入门到不踩坑,一次讲透
python·sql·postgresql·fastapi·web·postgres·db·asyncpg
yiyu0716
1 天前
3分钟搞懂深度学习AI:实操篇:池化层
人工智能·深度学习
亚马逊云开发者
1 天前
5 分钟用 Amazon Bedrock 搭一个 AI Agent:从零到能干活
人工智能·agent·amazon
小兵张健
1 天前
白嫖党的至暗时期
人工智能·chatgpt·aigc
IT_陈寒
1 天前
SpringBoot项目启动慢?5个技巧让你的应用秒级响应!
前端·人工智能·后端
用户835629078051
1 天前
使用 C# 在 Excel 中创建数据透视表
后端·python
小徐_2333
1 天前
向日葵 x AI:把远程控制封装成 MCP,让 AI 替我远程控制设备
前端·人工智能
桦说编程
1 天前
Harness Engineering — AI 时代的工程最佳实践
人工智能·架构·代码规范
老纪的技术唠嗑局
1 天前
Agent / Skills / Teams 架构演进流程及技术选型之道
人工智能·agent
热门推荐
01GitHub 镜像站点02OpenClaw 使用和管理 MCP 完全指南03本地部署 OpenClaw + DeepSeek-R1 完全指南04OpenClaw 连接飞书完整指南:插件安装、配置与踩坑记录05OpenClaw 飞书机器人不回复消息?3 小时踩坑总结06Window 10部署openclaw报错node.exe : npm error code 12807OpenClaw macOS 完整安装与本地模型配置教程(实战版)08OpenClaw 接入 QQ Bot 完整实践指南09得物前端部门,没了10npm-error code 128问题解决方法