大模型微调完整步骤( LLama-Factory)

一、LLaMA-Factory安装部署

在安装之前,首先需要有一个linux服务器 ,并在这个服务器上完成搭建,否则在后续配置和安装时可能会出现非常多的兼容性问题。如果本地是windows机器,推荐使用windows自带的hyper-v虚拟化出来一个linux环境。

LLaMA-Factory 的 Github地址:https://github.com/hiyouga/LLaMA-Factory

  • 克隆仓库

    git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git

  • 切换到项⽬⽬录

    cd LLaMA-Factory

  • 修改配置,将 conda 虚拟环境安装到数据盘(这⼀步也可不做)

    mkdir -p /root/autodl-tmp/conda/pkgs
    conda config --add pkgs_dirs /root/autodl-tmp/conda/pkgs
    mkdir -p /root/autodl-tmp/conda/envs
    conda config --add envs_dirs /root/autodl-tmp/conda/envs

  • 创建 conda 虚拟环境(⼀定要 3.10 的 python 版本,不然和 LLaMA-Factory 不兼容)

    conda create -n llama-factory python=3.10

  • 激活虚拟环境

    conda activate llama-factory

  • 在虚拟环境中安装 LLaMA Factory 相关依赖,注意:如报错 bash: pip: command not found ,先执⾏ conda install pip 即可

    pip install -e ".[torch,metrics]"

  • 检验是否安装成功

    llamafactory-cli version

二、启动 LLama-Factory的可视化微调界⾯ (由 Gradio驱动)

直接运行下面的命令:

复制代码
llamafactory-cli webui

2.1配置端口转发

如果使用了虚拟机、Docker或者购买云服务器,还需要配置端⼝转发,其中云服务器还需要开通防火墙端口。
在本地电脑的终端(cmd / powershell / terminal等)中执⾏代理命令,其中
root@123.125.240.150 和 42151 分别是实例中SSH指令的访问地址与端⼝,请找到⾃⼰实
例的ssh指令做相应替换。 7860:127.0.0.1:7860 是指代理实例内 7860 端⼝到本地的 7860
端⼝

复制代码
ssh -CNg -L 7860:127.0.0.1:7860 root@123.125.240.150 -p 42151

2.2从 HuggingFace上下载基座模型

HuggingFace 是⼀个集中管理和共享预训练模型的平台 https://huggingface.co;

  • 创建⽂件夹统⼀存放所有基座模型

    mkdir Hugging-Face

  • 修改 HuggingFace 的镜像源

    export HF_ENDPOINT=https://hf-mirror.com

  • 修改模型下载的默认位置

    export HF_HOME=/root/autodl-tmp/Hugging-Face

  • 注意:这种配置⽅式只在当前 shell 会话中有效,如果你希望这个环境变量在每次启动终端时都⽣效,可以将其添加到你的⽤户配置⽂件中(修改 ~/.bashrc 或 ~/.zshrc )

  • 检查环境变量是否⽣效

    echo HF_ENDPOINT echo HF_HOME

  • 安装 HuggingFace 官⽅下载⼯具

    pip install -U huggingface_hub

  • 执⾏下载命令

    huggingface-cli download --resume-download deepseek-ai/DeepSeek-R1-DistillQwen-1.5B

  • 如果直接本机下载了模型压缩包,如何放到你的服务器上?------在 AutoDL 上打开JupyterLab 直接上传,或者下载软件通过 SFTP 协议传送

三、可视化⻚⾯上加载模型测试,检验是否加载成功

注意:这⾥的路径是模型⽂件夹内部的模型特定快照的唯⼀哈希值,⽽不是整个模型⽂件夹

相关推荐
搞科研的小刘选手1 小时前
【同济大学主办】第十一届能源资源与环境工程研究进展国际学术会议(ICAESEE 2025)
大数据·人工智能·能源·材质·材料工程·地理信息
MARS_AI_1 小时前
云蝠智能 VoiceAgent 2.0:全栈语音交互能力升级
人工智能·自然语言处理·交互·信息与通信·agi
top_designer1 小时前
Substance 3D Stager:电商“虚拟摄影”工作流
人工智能·3d·设计模式·prompt·技术美术·教育电商·游戏美术
雷神大青椒1 小时前
离别的十字路口: 是否还记得曾经追求的梦想
人工智能·程序人生·职场和发展·玩游戏
m0_650108242 小时前
多模态大模型 VS. 图像视频生成模型浅析
人工智能·技术边界与协同·mllm与生成模型·技术浅谈
ai_xiaogui2 小时前
Mac苹果版Krita AI一键安装教程:AIStarter+ComfyUI零基础部署全流程(X86/ARM双架构)
arm开发·人工智能·macos·comfyui·一键部署·ai绘画教程·kritaai
lapiii3583 小时前
[智能体设计模式] 第11章:目标设定与监控模式
人工智能·设计模式
这张生成的图像能检测吗3 小时前
(论文速读)WFF-Net:用于表面缺陷检测的可训练权重特征融合卷积神经网络
人工智能·深度学习·神经网络·缺陷检测·图像分割
shayudiandian3 小时前
RNN与LSTM详解:AI是如何“记住”信息的?
人工智能·rnn·lstm
美人鱼战士爱学习3 小时前
2025 Large language models for intelligent RDF knowledge graph construction
人工智能·语言模型·知识图谱