书生浦语-模型微调

大语言模型微调

指令微调的流程



LoRA(旁路分支微调)



Xtuner微调框架



微调训练


作业

微调作业需要多训练几个epoch,这里训练了16个epoch

相关推荐
noravinsc2 分钟前
django models 多条件检索
后端·python·django
初尘屿风2 分钟前
基于Python的Flask微博话题舆情分析可视化系统设计与实现+毕业论文+指导搭建视频
开发语言·python·flask
CodeJourney.14 分钟前
DeepSeek在MATLAB上的部署与应用
数据库·人工智能·算法·架构
不苒16 分钟前
从卡顿到丝滑:火山引擎DeepSeek-R1引领AI工具新体验
人工智能·火山引擎
skywalk816322 分钟前
尝试在exo集群下使用deepseek模型:第一步,调通llama
人工智能·llama·exo
liruiqiang0526 分钟前
线性模型 - 支持向量机(参数学习)
人工智能·学习·机器学习·支持向量机
Archie_IT31 分钟前
Ollama辅助工具在思源笔记中的核心玩法助力实现AI高效创作
人工智能·笔记
HHUCESTA1 小时前
2025年信息科学与工程学院科协机器学习介绍——conda环境配置
人工智能·机器学习·conda
编织幻境的妖1 小时前
python的Tkinter小程序上传Excel并下载Text
python·小程序·excel
江梦寻1 小时前
在 M1 Mac 上解锁 TensorFlow GPU 加速:从环境搭建到实战验证
人工智能·pytorch·python·深度学习·macos·tensorflow·gpu算力