【GPT入门】第51课 将hf模型转换为GGUF

【GPT入门】第51课 将hf模型转换为GGUF

  • [1. 概述](#1. 概述)
    • [1.1 llama.cpp项目进行格式转换](#1.1 llama.cpp项目进行格式转换)
    • [1.2 执行转换](#1.2 执行转换)
    • [1.3 转换后的模型](#1.3 转换后的模型)
  • [2. ollama运行 GGUF](#2. ollama运行 GGUF)
    • [2.1 安装ollama](#2.1 安装ollama)
    • [2.2 启动ollama](#2.2 启动ollama)
    • [2.3 创建ModelFile](#2.3 创建ModelFile)
    • [2.4 创建自定义模型](#2.4 创建自定义模型)
    • [2.5 启动模型](#2.5 启动模型)

1. 概述

下文把Lora微调后的模型转为gguf格式,目的是可以让模型在ollama支持的机器上运行,用到llamacpp项目做格式转换,并使用ollama运行模型测试

1.1 llama.cpp项目进行格式转换

复制代码
git clone https://github.com/ggerganov/llama.cpp.git
 pip install -r llama.cpp/requirements.txt

1.2 执行转换

python llama.cpp/convert_hf_to_gguf.py /root/autodl-tmp/models/Qwen/Qwen2.5-0.5B-Instruct-merged-rzb --outtype f16 --verbose --outfile /root/autodl-tmp/models/Qwen/Qwen2.5-0.5B-Instruct-merged-rzb-gguf.gguf

1.3 转换后的模型

2. ollama运行 GGUF

2.1 安装ollama

复制代码
curl -fsSL https://ollama.com/install.sh | sh

2.2 启动ollama

复制代码
ollama serve

2.3 创建ModelFile

复制代码
 cat ModelFile 
# GGUF文件路径
FROM /root/autodl-tmp/models/Qwen/Qwen2.5-0.5B-Instruct-merged-ollama create Qwen2.5-0.5B-Instruct-merged-rzb --file ./ModelFile

2.4 创建自定义模型

复制代码
ollama create Qwen2.5-0.5B-Instruct-merged-rzb --file ./ModeFile

2.5 启动模型

复制代码
(base) root@autodl-container-89aa47baea-756ca94a:~/autodl-tmp# ollama list
NAME                                       ID              SIZE      MODIFIED           
Qwen2.5-0.5B-Instruct-merged-rzb:latest    bcba39310524    994 MB    About a minute ago    
(base) root@autodl-container-89aa47baea-756ca94a:~/autodl-tmp# ollama run Qwen2.5-0.5B-Instruct-merged-rzb:latest
相关推荐
柯儿的天空1 小时前
Mem0深度解析:给你的ai agent加上长期记忆,让ai从“健忘“到“过目不忘“
人工智能·gpt·自然语言处理·ai作画·aigc·ai编程·agi
智算菩萨9 小时前
深度剖析GPT - 5.3 - Codex:技术架构、性能表现与国内API接入全攻略
人工智能·gpt·ai·chatgpt·架构·ai编程·codex
weixin_419936929 小时前
MetaChat 更新:GPT-5.4 Mini / Nano 已上线,国内直接用
人工智能·gpt
ofoxcoding1 天前
2026 大模型 API 价格一览:GPT-5/Claude 4.6/Gemini 3/DeepSeek V3 费率实测对比
gpt·ai
柯儿的天空1 天前
【OpenClaw 全面解析:从零到精通】第 021 篇:Claw 家族全景——从桌面级到边缘部署的轻量级智能体变体深度解析
gpt·ai作画·自动化·aigc·ai编程·ai写作·agi
Hello.Reader1 天前
BERT 和 GPT 为什么结构不同?——Encoder 与 Decoder 图解
人工智能·gpt·bert
2501_945837432 天前
OpenClaw:让AI从“能说”到“能做”的智能体革命
gpt
程序媛小鱼2 天前
从预训练到Transformer到GPT
gpt·深度学习·bert·transformer
JavaPub-rodert2 天前
2026年国内 Codex 安装教程和使用教程:GPT-5.4 完整指南
gpt·chatgpt·openai·codex·gpt5.4
柯儿的天空2 天前
【OpenClaw 全面解析:从零到精通】第 019 篇:GoClaw 企业版——从开源到商业化的演进之路
gpt·开源·aigc·copilot·ai编程·ai写作·agi