通过LlaMA-Factory导出的模型部署到Ollama

LlaMA-Factory导出的模型转换格式

仓库地址:https://github.com/ggerganov/llama.cpp

git clone仓库之后,下载相关依赖:

markup 复制代码
cd /opt/gl/llama.cpp-master/llama.cpp-master
pip install -r requirements.txt

转换大模型格式

转换为gguf格式

markup 复制代码
 python convert_hf_to_gguf.py /opt/gl/model/lin_model --outfile /opt/gl/model/lin_model.gguf --outtype q8_0

创建ModelFile文件

markup 复制代码
FROM D:\ollama\models\lin_model\lin_model.gguf

添加自定义模型

markup 复制代码
ollama create lin_model -f D:\ollama\models\lin_model\ModelFile

查看本地模型

运行本地大模型

markup 复制代码
ollama run lin_model:latest
相关推荐
南汁bbj7 小时前
Llama 4 开源了!1.2 万亿参数 MoE 模型本地部署 + 推理测试(附代码)
开源·llama
万粉变现经纪人20 小时前
如何解决 pip install llama-cpp-python 报错 未安装 CMake/Ninja 或 CPU 不支持 AVX 问题
开发语言·python·开源·aigc·pip·ai写作·llama
wj3055853782 天前
Ollama Cloud 与直接使用 API 的对比
llm·llama
AI_小站4 天前
6个GitHub爆火的免费大模型教程,助你快速进阶AI编程
人工智能·langchain·github·知识图谱·agent·llama·rag
Mr_sst5 天前
infra-ai模块宏观设计解析:业务与模型之间的中间层核心架构
大数据·人工智能·ai·llama
微软技术分享5 天前
Windows平台下CUDA安装及llama.cpp使用教程
windows·llama
小wu学cv6 天前
llama.cpp调用GPU推理Qwen3.5-0.8b模型
llama
zhangfeng11336 天前
LLaMA-Factory 保存 checkpoint 时崩溃解决办法 OOM 内存溢出(不是显存)
运维·服务器·人工智能·深度学习·llama
老唐7777 天前
30分钟手搓 Agent:LLM + Tools + Loop + Memory 跑通最小闭环
人工智能·ai·语言模型·agent·llama·智能体
高兴就好(石8 天前
Mac使用llama.cpp
macos·llama