llama-factory微调大模型

一、背景

微调或者全量调大语言模型,还包括deepseek,想找个快速的微调教程,网上暂时没有

二、原理和步骤

原理:搭建环境太累了,还是docker环境镜像简单快捷

1、先下载模型

如果用本身的会自动从huggingface下载,这下不了(也没有提示)

from modelscope import snapshot_download
model_dir = snapshot_download('qwen/Qwen-7B')
print(model_dir )下载的路径

2、拉去LLAMA-factory repo

docker build -f ./Dockerfile -t llama-factory:latest .

3、要根据自己的目录调整启动镜像

docker run --gpus=all \
    -v 你下载的模型地址:/models/Qwen-7B \
    -v ./data:/app/data \
    -v ./output:/app/output \
    -e CUDA_VISIBLE_DEVICES=0 \
    -p 7860:7860 \
    --shm-size 16G \
    --name llama_factory \
    -d llama-factory:latest

三、访问web

地址:ip:7860

可以点击chat-load模型,并可以正常聊天了

其次就算微调模型,各种参数设置了

相关推荐
Jerry Lau1 小时前
大模型-本地化部署调用--基于ollama+openWebUI+springBoot
java·spring boot·后端·llama
斯多葛的信徒3 小时前
看看你的电脑可以跑 AI 模型吗?
人工智能·语言模型·电脑·llama
AGI学习社3 小时前
2024中国排名前十AI大模型进展、应用案例与发展趋势
linux·服务器·人工智能·华为·llama
周杰伦_Jay20 小时前
Ollama能本地部署Llama 3等大模型的原因解析(ollama核心架构、技术特性、实际应用)
数据结构·人工智能·深度学习·架构·transformer·llama
engchina20 小时前
如何使 LLaMA-Factory 支持 google/gemma-2-2b-jpn-it 的微调
llama-factory
Allen200003 天前
wow-agent---task2使用llama-index创建Agent
人工智能·llama
不是吧这都有重名3 天前
[Datawheel学习]用Llama-index创建Agent、数据库对话Agent和RAG接入Agent
数据库·学习·llama
RockWang.3 天前
【llama_factory】qwen2_vl训练与批量推理
llama·qwen2-vl
beyond阿亮5 天前
llama.cpp编译和运行 API调用
c++·人工智能·ai·llama
玄明Hanko6 天前
小模型干大事情,基于LLaMA-Factory+Lora入门级微调开源AI模型
人工智能·llama