llama-factory微调大模型

一、背景

微调或者全量调大语言模型,还包括deepseek,想找个快速的微调教程,网上暂时没有

二、原理和步骤

原理:搭建环境太累了,还是docker环境镜像简单快捷

1、先下载模型

如果用本身的会自动从huggingface下载,这下不了(也没有提示)

复制代码
from modelscope import snapshot_download
model_dir = snapshot_download('qwen/Qwen-7B')
print(model_dir )下载的路径

2、拉去LLAMA-factory repo

复制代码
docker build -f ./Dockerfile -t llama-factory:latest .

3、要根据自己的目录调整启动镜像

复制代码
docker run --gpus=all \
    -v 你下载的模型地址:/models/Qwen-7B \
    -v ./data:/app/data \
    -v ./output:/app/output \
    -e CUDA_VISIBLE_DEVICES=0 \
    -p 7860:7860 \
    --shm-size 16G \
    --name llama_factory \
    -d llama-factory:latest

三、访问web

地址:ip:7860

可以点击chat-load模型,并可以正常聊天了

其次就算微调模型,各种参数设置了

相关推荐
Aaron_9453 小时前
LLaMA Factory:一站式大语言模型高效微调框架解析
人工智能·语言模型·llama
小呀小萝卜儿1 天前
2026-01-14 学习记录--LLM-申请Hugging Face 访问令牌(以Meta-Llama-3.1-8B-Instruct为例)
学习·语言模型·llama
I'm Salted Fish1 天前
基于LLaMA-Factory大语言模型微调实战-训练一个属于自己的大模型
人工智能·语言模型·llama
不爱学英文的码字机器1 天前
数据不出域!用 Atlas 800T 激活 Llama-3,打造安全可控的 QA 生产工厂
安全·llama
大模型实验室Lab4AI2 天前
LLama-Factory官方课程答疑汇总+课程内容升级(多模态实战)
llama
AI吃大瓜3 天前
LLaMA-Factory微调多模态大模型Qwen3-VL
视频分析·llama-factory·qwen3-vl
范桂飓3 天前
LLaMA-Factory 大模型微调平台
人工智能·llama
杜子不疼.3 天前
【大模型 】API 对接指南:OpenAI/Claude/LLaMA 3 调用技巧
llama
小Pawn爷4 天前
11.大模型评估
llm·llama·fingpt
薛定谔的猫19826 天前
LlamaIndex(一)初见
llama·llamaindex