【GPT入门】第51课 将hf模型转换为GGUF

【GPT入门】第51课 将hf模型转换为GGUF

  • [1. 概述](#1. 概述)
    • [1.1 llama.cpp项目进行格式转换](#1.1 llama.cpp项目进行格式转换)
    • [1.2 执行转换](#1.2 执行转换)
    • [1.3 转换后的模型](#1.3 转换后的模型)
  • [2. ollama运行 GGUF](#2. ollama运行 GGUF)
    • [2.1 安装ollama](#2.1 安装ollama)
    • [2.2 启动ollama](#2.2 启动ollama)
    • [2.3 创建ModelFile](#2.3 创建ModelFile)
    • [2.4 创建自定义模型](#2.4 创建自定义模型)
    • [2.5 启动模型](#2.5 启动模型)

1. 概述

下文把Lora微调后的模型转为gguf格式,目的是可以让模型在ollama支持的机器上运行,用到llamacpp项目做格式转换,并使用ollama运行模型测试

1.1 llama.cpp项目进行格式转换

复制代码
git clone https://github.com/ggerganov/llama.cpp.git
 pip install -r llama.cpp/requirements.txt

1.2 执行转换

python llama.cpp/convert_hf_to_gguf.py /root/autodl-tmp/models/Qwen/Qwen2.5-0.5B-Instruct-merged-rzb --outtype f16 --verbose --outfile /root/autodl-tmp/models/Qwen/Qwen2.5-0.5B-Instruct-merged-rzb-gguf.gguf

1.3 转换后的模型

2. ollama运行 GGUF

2.1 安装ollama

复制代码
curl -fsSL https://ollama.com/install.sh | sh

2.2 启动ollama

复制代码
ollama serve

2.3 创建ModelFile

复制代码
 cat ModelFile 
# GGUF文件路径
FROM /root/autodl-tmp/models/Qwen/Qwen2.5-0.5B-Instruct-merged-ollama create Qwen2.5-0.5B-Instruct-merged-rzb --file ./ModelFile

2.4 创建自定义模型

复制代码
ollama create Qwen2.5-0.5B-Instruct-merged-rzb --file ./ModeFile

2.5 启动模型

复制代码
(base) root@autodl-container-89aa47baea-756ca94a:~/autodl-tmp# ollama list
NAME                                       ID              SIZE      MODIFIED           
Qwen2.5-0.5B-Instruct-merged-rzb:latest    bcba39310524    994 MB    About a minute ago    
(base) root@autodl-container-89aa47baea-756ca94a:~/autodl-tmp# ollama run Qwen2.5-0.5B-Instruct-merged-rzb:latest
相关推荐
m0_535817552 小时前
Claude Code国内直连教程:从0到1安装配置(附API中转方案,亲测跑通)
windows·gpt·ai·api·claude·claudecode·88api
Aision_3 小时前
OpenClaw和Hermes的记忆有什么区别
人工智能·gpt·langchain·prompt·aigc·agi
AIBox3659 小时前
Claude 中转站怎么接入:2026 年国内调用 Claude API 的方法、能力与示例
服务器·开发语言·人工智能·gpt·php·python3.11
147API10 小时前
GPT 上线指标怎么设计:采纳率、错误率和调用成本
人工智能·gpt
小何code10 小时前
人工智能【第25篇】GPT模型详解:生成式预训练的语言模型
人工智能·gpt·语言模型·chatgpt·大模型·生成式ai
guokai.wu10 小时前
Codex 进阶使用技巧:用“任务分层”提升复杂需求开发效率(ps: Codex免费使用)
gpt·codex·vibe coding
dhashdoia1 天前
GPT-5.5 代码开发实战:Codex与Browser Use深度集成与星链4SAPI优化方案
java·数据库·人工智能·gpt·架构
迪娜学姐1 天前
调用GPT image 2一键批量美化项目申请答辩PPT
人工智能·gpt·chatgpt·powerpoint·ppt
CS创新实验室1 天前
OpenAI GPT-5.5 技术深度报告
人工智能·gpt·大模型·llm
dhashdoia1 天前
2026年深度体验:OpenAI Codex App如何重塑AI辅助编程工作流
人工智能·gpt·深度学习·claude