书生浦语-模型微调

大语言模型微调

指令微调的流程



LoRA(旁路分支微调)



Xtuner微调框架



微调训练


作业

微调作业需要多训练几个epoch,这里训练了16个epoch

相关推荐
秃头狂魔几秒前
【HOT100】DAY2
python·算法
易知微EasyV数据可视化2 分钟前
数字孪生+AI:某国家级技术科研机构:耦合仿真评估部件性能,长期运维监测承压状态
人工智能·经验分享·物联网·数字孪生·空间智能
六个点4 分钟前
A2A协议入门:构建Agent之间的通信标准
人工智能
大学有意思4 分钟前
广西英华国际职业学院新能源汽车技术专业2026年权威解析
人工智能·机器人
枫叶林FYL4 分钟前
【自然语言处理 NLP】 大语言模型(LLM)系统工程(Large Language Model Engineering)5.1.2 ZeRO与显存优化技术
人工智能·深度学习·机器学习
Flying pigs~~5 分钟前
基于huggingface库Trainer实现Bert文本分类实战
人工智能·自然语言处理·bert·文本分类·huggingface·trainer
Gale2World8 分钟前
专题九:【终局演进】从“单体网关”到去中心化集群:分布式数字员工(Swarm)的宏大涌现
人工智能·agent
天天代码码天天9 分钟前
C# OnnxRuntime BEN2 前景分割
人工智能
程序员三藏9 分钟前
接口自动化测试思路和实战:编写线性测试脚本实战
自动化测试·软件测试·python·测试工具·职场和发展·测试用例·接口测试
moers9 分钟前
从cosh到AgentSecCore:拆解阿里云Agentic OS的四个技术决策
人工智能