MiniCPM5-1B - 随身AI智能助手 擅长工具使用和复杂推理,长上下文处理能力强 一键整合包下载

MiniCPM5-1B 是一款由 OpenBMB 团队开发的1B参数(约10亿)小型语言模型,属于 MiniCPM5 系列的第一个版本。外号"面壁小钢炮",简单说,它就是一个体积小、能力强、适合本地运行的 AI 助手。

MiniCPM5-1B 就是目前最强的小模型之一,专为"本地跑、不想依赖云端"的人设计,在体积和能力之间找到了很好的平衡,特别适合个人开发者、隐私场景和资源受限的环境。

主要特点

超级小巧,省资源:只有1B参数,能轻松跑在手机、笔记本、边缘设备甚至普通电脑上,不需要高端显卡。

1B级别最强(SOTA):在同等大小的开源模型里,整体能力最优秀,尤其在工具调用(Agent)、代码生成、复杂推理上表现突出。

混合思考模式:同一个模型可以"快速回答"或"慢慢思考"。通过 enable_thinking 开关切换,想快就快,想严谨就让它一步步推理(类似 <think> 标签)。

超长上下文:支持 131072 tokens(约10万+字),能一次性处理很长的文档、代码库或对话历史。

好部署:基于标准 Llama 架构,兼容 vLLM、SGLang、Ollama、llama.cpp、LM Studio 等主流工具,还有 GGUF、MLX 等量化版本,手机/电脑本地跑都很方便。

支持工具调用:能很好地调用外部工具、函数,适合做智能 Agent。

应用领域

本地私人助手:手机、电脑上跑的离线 AI 聊天、问答(隐私好、不联网)。

代码助手 / 编程 Agent:写代码、调试、理解代码仓库,特别适合开发者本地使用。

工具使用场景:能调用 API、操作工具的多步任务(比如自动处理工作流)。

长文档处理:分析长 PDF、报告、书籍,或做长上下文推理。

边缘计算 / 设备端 AI:资源有限的设备上运行智能功能(如机器人、IoT、智能硬件)。

桌面宠物 / 趣味应用:官方还做了用它驱动的本地桌面小宠物,交互很有趣。

使用教程: (建议N卡,显存4G起,支持50系显卡)

支持思考/非思考两种模式,输入问题或需求,提交即可。

支持消费级笔记本流畅运行,实测4G显存+8G运存流畅运行。

支持WebUI和GUI两种运行模式,支持api,可对接三方Agent使用

启动后 API 地址为:`http://localhost:8000`

兼容open-ai 格式api,请求参数

复制代码
{
  "model": "minicpm5-1b",
  "messages": [
    {"role": "system", "content": "You are a helpful assistant."},
    {"role": "user", "content": "你好"}
  ],
  "temperature": 0.9,
  "top_p": 0.95,
  "max_tokens": 4096,
  "stream": false,
  "thinking_mode": true
}

crul格式

复制代码
curl http://localhost:8000/v1/chat/completions \
  -H "Content-Type: application/json" \
  -d '{
    "model": "minicpm5-1b",
    "messages": [
      {"role": "user", "content": "用Python写一个计算器"}
    ],
    "temperature": 0.7,
    "stream": false
  }'

下载地址:点此下载

相关推荐
J2虾虾1 小时前
Spring AI Alibaba - Skills 技能
人工智能·python·spring
冰西瓜6001 小时前
深度学习的数学原理(四十)—— Transformer 推理全过程
人工智能·深度学习·transformer
Bingorl1 小时前
机器学习之集成学习
人工智能·机器学习·集成学习
weixin_468466851 小时前
SURF 图像特征提取算法新手实战指南
图像处理·人工智能·算法·机器视觉·surf·sift
盛夏光年爱学习1 小时前
Agentic RAG 深度解析:让 Agent 自己决定要不要检索、检索几次,这才是 RAG 的正确打开方式
人工智能
weiwin1231 小时前
MAF入门(3 下):多轮对话进阶——清除历史、注入 System、截断策略
人工智能·agent
Coder小相2 小时前
LangChain 1.0 第五篇 - Tool与MCP让Agent拥有行动力
人工智能·langchain·ai编程
太华2 小时前
学习AI Agent编程-第五天-LlamaIndex - 将Nodes生成索引并存储
人工智能
太华2 小时前
学习AI Agent编程-第三天-LlamaIndex - 如何将PDF文件正确转成Document
人工智能