通过LlaMA-Factory导出的模型部署到Ollama

LlaMA-Factory导出的模型转换格式

仓库地址:https://github.com/ggerganov/llama.cpp

git clone仓库之后,下载相关依赖:

markup 复制代码
cd /opt/gl/llama.cpp-master/llama.cpp-master
pip install -r requirements.txt

转换大模型格式

转换为gguf格式

markup 复制代码
 python convert_hf_to_gguf.py /opt/gl/model/lin_model --outfile /opt/gl/model/lin_model.gguf --outtype q8_0

创建ModelFile文件

markup 复制代码
FROM D:\ollama\models\lin_model\lin_model.gguf

添加自定义模型

markup 复制代码
ollama create lin_model -f D:\ollama\models\lin_model\ModelFile

查看本地模型

运行本地大模型

markup 复制代码
ollama run lin_model:latest
相关推荐
薛定谔的猫19821 天前
LlamaIndex(一)初见
llama·llamaindex
Android小码家3 天前
llama.cpp+Android应用定制
android·llama
Android小码家3 天前
WSL+llama+CPU本地模型部署
llama·wsl·模型
沛沛老爹3 天前
Web开发者5分钟上手:Agent Skills环境搭建与基础使用实战
java·人工智能·llm·llama·rag·agent skills
星辰引路-Lefan4 天前
在浏览器中运行大模型:基于 WebGPU 的本地 LLM 应用深度解析
ai·ai编程·llama·gpu算力
natide4 天前
text-generateion-webui模型加载器(Model Loaders)选项
人工智能·llama
*星星之火*4 天前
【大模型进阶】视频课程2 LORA微调原理深度解析+LLaMA Factory实操指南:小白也能玩转大模型定制
lora·大模型·微调·llama·llama factory
natide5 天前
Llama2 API部署错误调试
fastapi·llama
沛沛老爹5 天前
用 Web 开发思维理解 Agent 的三大支柱——Tools + Memory + LLM
java·人工智能·llm·llama·rag
沛沛老爹5 天前
Web开发者深度解析Function Calling:Fc全链路机制与实战原理解析
java·人工智能·llm·llama·rag·web转型