初始化大模型的不同方式

  • llama.cpp =「发动机」------ 纯推理库,命令行或 C/C++ API 调用,什么都要自己拼。

  • Ollama =「整车」------ 把 llama.cpp 发动机包成 Docker 式服务,一键拉模型、自动启停、REST/OpenAI 兼容,零配置就能用。

| 维度 | llama.cpp | Ollama |
|-------|-------------------------------------|-------------------------------------------------------------------------------------------------------------|------|
| 定位 | 底层推理引擎 | 上层模型运行工具 |
| 安装 | 需自编译或下 release 二进制 | 一条 `curl -fsSL https://ollama.ai/install.sh | sh` |
| 模型获取 | 手工下载/转换 GGUF | ollama pull qwen2.5:7b 自动完成 |
| 启动方式 | ./main./server 手动指定参数 | ollama run qwen2.5:7b 直接对话 |
| 接口 | 命令行、C/C++ API、可启 HTTP 但需自己写 systemd | 默认 11434 端口,OpenAI 格式即开即用 |
| 配置 | 全程命令行参数,无持久化 | 自动写 systemd 服务,Modelfile 管理参数 |
| 多模型并行 | 自己开多个端口/进程 | ollama run llama3 另开实例即可 |
| 跨平台 | 全平台,需自己管 GPU 驱动 | 同样全平台,GPU 依赖自动检测 |
| 适用人群 | 需要深度定制、嵌入式、最小体积 | 想 5 分钟搭好本地 LLM 服务 |

相关推荐
坤岭8 分钟前
大模型“入侵”广告推荐
人工智能·langchain·推荐算法
嵌入式-小王2 小时前
LangChain框架(二)---- 提示词模板
python·langchain
来一斤小鲜肉2 小时前
一文搞懂:如何用 Spring AI 搭建 MCP Server 和 Client
后端·langchain
Csvn1 天前
🌟 LangChain 30 天保姆级教程 · Day 13|OutputParser 进阶!让 AI 输出自动转为结构化对象,并支持自动重试!
python·langchain
InKomorebi1 天前
LangChain Tools:BaseTool/Callable/Runnable 核心类型 | 三种工具定义方式 | 串行与并行调用 | 错误处理与重试降级
langchain
怕浪猫1 天前
第10章 RAG(检索增强生成)系统构建(LangChain实战)
langchain·aigc·ai编程
阿捞21 天前
python-langchain框架(3-20-智能问答ZeroShot_ReAct Agent 从零搭建)
python·react.js·langchain
qyhua1 天前
开源推荐 | ModelX RAG:基于 LangChain + Ollama 的企业级知识库系统
python·langchain·开源
斯外戈的小白2 天前
【Agent】LangChain 1.0架构
架构·langchain
tkevinjd2 天前
基于LangChain的简易智能旅游助手Agent
langchain·agent