【GPT入门】第51课 将hf模型转换为GGUF

【GPT入门】第51课 将hf模型转换为GGUF

  • [1. 概述](#1. 概述)
    • [1.1 llama.cpp项目进行格式转换](#1.1 llama.cpp项目进行格式转换)
    • [1.2 执行转换](#1.2 执行转换)
    • [1.3 转换后的模型](#1.3 转换后的模型)
  • [2. ollama运行 GGUF](#2. ollama运行 GGUF)
    • [2.1 安装ollama](#2.1 安装ollama)
    • [2.2 启动ollama](#2.2 启动ollama)
    • [2.3 创建ModelFile](#2.3 创建ModelFile)
    • [2.4 创建自定义模型](#2.4 创建自定义模型)
    • [2.5 启动模型](#2.5 启动模型)

1. 概述

下文把Lora微调后的模型转为gguf格式,目的是可以让模型在ollama支持的机器上运行,用到llamacpp项目做格式转换,并使用ollama运行模型测试

1.1 llama.cpp项目进行格式转换

复制代码
git clone https://github.com/ggerganov/llama.cpp.git
 pip install -r llama.cpp/requirements.txt

1.2 执行转换

python llama.cpp/convert_hf_to_gguf.py /root/autodl-tmp/models/Qwen/Qwen2.5-0.5B-Instruct-merged-rzb --outtype f16 --verbose --outfile /root/autodl-tmp/models/Qwen/Qwen2.5-0.5B-Instruct-merged-rzb-gguf.gguf

1.3 转换后的模型

2. ollama运行 GGUF

2.1 安装ollama

复制代码
curl -fsSL https://ollama.com/install.sh | sh

2.2 启动ollama

复制代码
ollama serve

2.3 创建ModelFile

复制代码
 cat ModelFile 
# GGUF文件路径
FROM /root/autodl-tmp/models/Qwen/Qwen2.5-0.5B-Instruct-merged-ollama create Qwen2.5-0.5B-Instruct-merged-rzb --file ./ModelFile

2.4 创建自定义模型

复制代码
ollama create Qwen2.5-0.5B-Instruct-merged-rzb --file ./ModeFile

2.5 启动模型

复制代码
(base) root@autodl-container-89aa47baea-756ca94a:~/autodl-tmp# ollama list
NAME                                       ID              SIZE      MODIFIED           
Qwen2.5-0.5B-Instruct-merged-rzb:latest    bcba39310524    994 MB    About a minute ago    
(base) root@autodl-container-89aa47baea-756ca94a:~/autodl-tmp# ollama run Qwen2.5-0.5B-Instruct-merged-rzb:latest
相关推荐
百***24378 小时前
GPT-5.2 技术升级与极速接入指南:从版本迭代到落地实践
大数据·人工智能·gpt
百***243713 小时前
GPT-5.2 vs Claude-Opus-4.5 深度测评与选型指南:从能力对比到第三方API落地实践
gpt
Constantine3713 小时前
GPT-5.2正式发布!国内首发“喂饭级”使用教程
gpt
古城小栈15 小时前
边缘大模型本地部署与推理实战:以GPT-OSS-20B为例
人工智能·gpt·语言模型·边缘计算
Ztop16 小时前
没有发布会,GPT Image 1.5 凌晨发布,实测与Nano Banana2相比,各有优势,但也一言难尽...
gpt·chatgpt
百***243716 小时前
GPT-5.2核心优势详解与极速接入指南(含与GPT-5.1对比)
人工智能·gpt
飞哥数智坊19 小时前
TRAE 内 GPT-5.2 实测:10 轮对话,生成的代码一次都没让我撤回
人工智能·gpt·trae
百***787519 小时前
【保姆级教程】GPT-5.1极速接入指南:3步上手多模态AI能力
大数据·python·gpt·opencv
百***243719 小时前
GPT-5.1与GPT-5.2对比及GPT-5.2极速接入指南
gpt
人工小情绪19 小时前
大模型核心原理-关键技术解析:预训练、SFT、RLHF
人工智能·gpt