模型合并,转换,量化压缩,部署

训练好的LoRA适配器模型合并转换为GGUF量化压缩部署

复制代码
model_name_or_path: /home/aistudio/text_lora/models/Qwen/Qwen3-4B-Instruct-2507  # 你的基础模型路径
adapter_name_or_path: output/qwen3-4b-sft-v9                                   # 你的LoRA适配器输出路径
template: qwen                                                                 # 使用你模型对应的template,如qwen
finetuning_type: lora                                                          # 微调方式,与你训练时一致
export_dir: models/qwen3-4b-merged                                             # 合并后模型的保存路径
export_size: 4                                                                 # 单文件大小上限,单位为GB (可选)
export_device: cpu                                                             # 导出计算设备,推荐cpu (可选)
export_legacy_format: false                                                    # 是否使用旧格式 (可选)

conda activate /home/aistudio/work/my_conda_envs/llamafactory

执行命令:

复制代码
llamafactory-cli export merge_config.yaml

合并后的目录如下:

复制代码
git clone https://git.ustc.edu.cn/USTC-OS-Lab/llama.cpp

cd llama.cpp

cmake -B build

cmake --build build --config Release -j --target llama-quantize

开始转换

进入 llama.cpp 目录,执行转换命令。

  1. 基础转换 (FP16):首先将合并后的模型转换为 FP16 精度的 GGUF 文件。

    复制代码
    python convert_hf_to_gguf.py /home/aistudio/text_lora/LLaMA-Factory/models/qwen3-4b-merged/ --outfile /home/aistudio/llama.cpp/qwen3-4b-f16.gguf --outtype f16

量化压缩 (Q4_K_M) :使用 llama-quantize 工具对上一步生成的 FP16 文件进行量化,以减小模型体积并提升推理速度。

复制代码
./build/bin/llama-quantize /home/aistudio/llama.cpp/qwen3-4b-f16.gguf /home/aistudio/llama.cpp/qwen3-4b-q4_k_m.gguf Q4_K_M
相关推荐
weixin_46846685几秒前
工业相机成像原理新手入门指南
人工智能·自动化·机器视觉·工业相机·光学·光学系统·成像原理
回眸&啤酒鸭4 分钟前
【回眸】CSDN新增功能测评——AI数字营销之内容创作
人工智能
小糖学代码7 分钟前
LLM系列:环境搭建:5.Python-dotenv 环境变量管理
人工智能·python·深度学习·神经网络
云安全助手12 分钟前
2026年企业级Claude中转服务深度评测:安全、稳定与速度的终极答案
人工智能·安全·claude·ai大模型
o561-6o623o7鹿18 分钟前
陈,机能实验室整体解决方案 人体生理实验整体解决方案 基础医学机能实验室建设
人工智能
代码柏拉图31 分钟前
Agent Skill 制作手册 01:入门篇
人工智能
珂朵莉MM41 分钟前
第七届全球校园人工智能算法精英大赛-算法巅峰赛产业命题赛第3赛季优化题--束搜索
人工智能·算法
智慧物业老杨41 分钟前
智慧物业合同周期管理系统:从风险预警到智能交接的全流程数智化落地方案
java·人工智能·python
科技AI训练师41 分钟前
2026高压清洗泵厂家选择指南:判断标准与选购要点
大数据·人工智能
Front思42 分钟前
AI前端工程师需要具备能力+
前端·人工智能·ai