【GPT入门】第51课 将hf模型转换为GGUF

【GPT入门】第51课 将hf模型转换为GGUF

  • [1. 概述](#1. 概述)
    • [1.1 llama.cpp项目进行格式转换](#1.1 llama.cpp项目进行格式转换)
    • [1.2 执行转换](#1.2 执行转换)
    • [1.3 转换后的模型](#1.3 转换后的模型)
  • [2. ollama运行 GGUF](#2. ollama运行 GGUF)
    • [2.1 安装ollama](#2.1 安装ollama)
    • [2.2 启动ollama](#2.2 启动ollama)
    • [2.3 创建ModelFile](#2.3 创建ModelFile)
    • [2.4 创建自定义模型](#2.4 创建自定义模型)
    • [2.5 启动模型](#2.5 启动模型)

1. 概述

下文把Lora微调后的模型转为gguf格式,目的是可以让模型在ollama支持的机器上运行,用到llamacpp项目做格式转换,并使用ollama运行模型测试

1.1 llama.cpp项目进行格式转换

复制代码
git clone https://github.com/ggerganov/llama.cpp.git
 pip install -r llama.cpp/requirements.txt

1.2 执行转换

python llama.cpp/convert_hf_to_gguf.py /root/autodl-tmp/models/Qwen/Qwen2.5-0.5B-Instruct-merged-rzb --outtype f16 --verbose --outfile /root/autodl-tmp/models/Qwen/Qwen2.5-0.5B-Instruct-merged-rzb-gguf.gguf

1.3 转换后的模型

2. ollama运行 GGUF

2.1 安装ollama

复制代码
curl -fsSL https://ollama.com/install.sh | sh

2.2 启动ollama

复制代码
ollama serve

2.3 创建ModelFile

复制代码
 cat ModelFile 
# GGUF文件路径
FROM /root/autodl-tmp/models/Qwen/Qwen2.5-0.5B-Instruct-merged-ollama create Qwen2.5-0.5B-Instruct-merged-rzb --file ./ModelFile

2.4 创建自定义模型

复制代码
ollama create Qwen2.5-0.5B-Instruct-merged-rzb --file ./ModeFile

2.5 启动模型

复制代码
(base) root@autodl-container-89aa47baea-756ca94a:~/autodl-tmp# ollama list
NAME                                       ID              SIZE      MODIFIED           
Qwen2.5-0.5B-Instruct-merged-rzb:latest    bcba39310524    994 MB    About a minute ago    
(base) root@autodl-container-89aa47baea-756ca94a:~/autodl-tmp# ollama run Qwen2.5-0.5B-Instruct-merged-rzb:latest
相关推荐
晓晓不觉早6 小时前
OpenAI Codex App的推出:多代理工作流的新时代
人工智能·gpt
kebijuelun10 小时前
Towards Automated Kernel Generation in the Era of LLMs:LLM 时代的自动化 Kernel 生成全景图
人工智能·gpt·深度学习·语言模型
卖芒果的潇洒农民2 天前
20260201 GPT VPC中的CIDR Block 概念
笔记·gpt
薛定谔的猫19822 天前
二十、使用PyTorch和Hugging Face Transformers训练中文GPT-2模型的技术实践
人工智能·pytorch·gpt
向量引擎小橙5 天前
Google 帝国的绝地反击:Gemini 3 深度硬核测评——GPT-5 的噩梦来了吗?
开发语言·人工智能·gpt·深度学习·机器学习
原来是你~呀~5 天前
Kali GPT - 人工智能渗透测试助手Linux部署
linux·人工智能·gpt·网络安全·自动化渗透测试
康康的AI博客5 天前
2026 OpenAI技术全景:GPT-5.2领衔的AI革命与DMXAPI无缝替代方案
人工智能·gpt
范桂飓5 天前
Transformer 大模型架构深度解析(5)GPT 与 LLM 大语言模型技术解析
人工智能·gpt·语言模型·transformer
七夜zippoe5 天前
大模型低成本高性能演进 从GPT到DeepSeek的技术实战手记
人工智能·gpt·算法·架构·deepseek
独自归家的兔6 天前
实测拆解:Qwen3-Max-Thinking 到底能不能对标 GPT-5.2?
gpt