初始化大模型的不同方式

  • llama.cpp =「发动机」------ 纯推理库,命令行或 C/C++ API 调用,什么都要自己拼。

  • Ollama =「整车」------ 把 llama.cpp 发动机包成 Docker 式服务,一键拉模型、自动启停、REST/OpenAI 兼容,零配置就能用。

| 维度 | llama.cpp | Ollama |
|-------|-------------------------------------|-------------------------------------------------------------------------------------------------------------|------|
| 定位 | 底层推理引擎 | 上层模型运行工具 |
| 安装 | 需自编译或下 release 二进制 | 一条 `curl -fsSL https://ollama.ai/install.sh | sh` |
| 模型获取 | 手工下载/转换 GGUF | ollama pull qwen2.5:7b 自动完成 |
| 启动方式 | ./main./server 手动指定参数 | ollama run qwen2.5:7b 直接对话 |
| 接口 | 命令行、C/C++ API、可启 HTTP 但需自己写 systemd | 默认 11434 端口,OpenAI 格式即开即用 |
| 配置 | 全程命令行参数,无持久化 | 自动写 systemd 服务,Modelfile 管理参数 |
| 多模型并行 | 自己开多个端口/进程 | ollama run llama3 另开实例即可 |
| 跨平台 | 全平台,需自己管 GPU 驱动 | 同样全平台,GPU 依赖自动检测 |
| 适用人群 | 需要深度定制、嵌入式、最小体积 | 想 5 分钟搭好本地 LLM 服务 |

相关推荐
玄同76512 小时前
Llama.cpp 全实战指南:跨平台部署本地大模型的零门槛方案
人工智能·语言模型·自然语言处理·langchain·交互·llama·ollama
玄同76512 小时前
LangChain v1.0+ Prompt 模板完全指南:构建精准可控的大模型交互
人工智能·语言模型·自然语言处理·langchain·nlp·交互·知识图谱
一只理智恩13 小时前
筹备计划·江湖邀请令!!!
python·langchain
华大哥13 小时前
AI大模型基于LangChain 进行RAG与Agent智能体开发
人工智能·langchain
玄同76514 小时前
LangChain v1.0+ Retrieval模块完全指南:从文档加载到RAG实战
人工智能·langchain·知识图谱·embedding·知识库·向量数据库·rag
Bruk.Liu1 天前
(LangChain实战2):LangChain消息(message)的使用
开发语言·langchain
疯狂踩坑人1 天前
【Python版 2026 从零学Langchain 1.x】(二)结构化输出和工具调用
后端·python·langchain
冀博1 天前
从零到一:我如何用 LangChain + 智谱 AI 搭建具备“记忆与手脚”的智能体
人工智能·langchain
qq_455760851 天前
langchain(二)
langchain
nvd112 天前
LangChain 经典回顾:ConversationBufferMemory 与 ConversationChain
langchain