llama-factory微调大模型

一、背景

微调或者全量调大语言模型,还包括deepseek,想找个快速的微调教程,网上暂时没有

二、原理和步骤

原理:搭建环境太累了,还是docker环境镜像简单快捷

1、先下载模型

如果用本身的会自动从huggingface下载,这下不了(也没有提示)

from modelscope import snapshot_download
model_dir = snapshot_download('qwen/Qwen-7B')
print(model_dir )下载的路径

2、拉去LLAMA-factory repo

docker build -f ./Dockerfile -t llama-factory:latest .

3、要根据自己的目录调整启动镜像

docker run --gpus=all \
    -v 你下载的模型地址:/models/Qwen-7B \
    -v ./data:/app/data \
    -v ./output:/app/output \
    -e CUDA_VISIBLE_DEVICES=0 \
    -p 7860:7860 \
    --shm-size 16G \
    --name llama_factory \
    -d llama-factory:latest

三、访问web

地址:ip:7860

可以点击chat-load模型,并可以正常聊天了

其次就算微调模型,各种参数设置了

相关推荐
华为云开发者联盟3 分钟前
一文为你深度解析LLaMA2模型架构
大模型·nlp·llama·transformers·华为云开发者联盟
弈秋0012 小时前
llama-factory训练RLHF-PPO模型
人工智能·深度学习·语言模型·自然语言处理·chatgpt·transformer·llama
微凉的衣柜4 小时前
掌握Llama 2分词器:填充、提示格式及更多
人工智能·算法·llama
WHY-2334 小时前
大模型学习笔记3【大模型】LLaMA学习笔记
笔记·学习·llama
有梦想的鱼6 小时前
llama.cpp
llama
营赢盈英16 小时前
使用 Ollama 时遇到的问题
python·ai·llm·llama·llama-index
yuanlulu1 天前
在昇腾服务器上使用llama-factory对baichuan2-13b模型进行lora微调
人工智能·深度学习·lora·nlp·大语言模型·llama
大耳朵爱学习2 天前
大模型技术:能否引领十年的行业变革与职业发展黄金期?......
人工智能·程序人生·语言模型·自然语言处理·大模型·llm·llama
爱喝白开水a2 天前
Llama也能做图像生成?文生图模型已开源
人工智能·科技·llm·大语言模型·llama·ai大模型·计算机技术
拉达曼迪斯II2 天前
小型语言模型的兴起
ai·语言模型·stable diffusion·ai编程·llama·dall·e 2