2025 年的年末,AI 编程圈子比以往任何时候都要热闹。就在大家都以为今年的大模型混战已经尘埃落定的时候,Mistral AI 在 12 月 9 日突然杀了个回马枪,发布了全新的 Devstral 2 编程模型家族,以及一个让人眼前一亮的终端工具 Mistral Vibe CLI。
这次发布不仅仅是丢出两个权重文件那么简单,Mistral 显然是看准了现在最火的"Agentic Coding"(代理式编程)赛道,试图用开源方案去动一动闭源巨头们的奶酪。
如果你是开发者,或者是对本地部署感兴趣的技术极客,这次更新里有几个必须要关注的硬核细节。

所谓的"Vibe Coding"到底是什么?
Mistral 这次主打的概念很有意思,叫"Vibe Coding"。听起来玄乎,但落地到产品 Mistral Vibe CLI 上,逻辑其实非常简单粗暴:把 AI 从单纯的"聊天框"里解放出来,直接塞进你的终端(Terminal)。
以往我们用 ChatGPT 写代码,流程通常是:复制需求 -> 粘贴代码 -> 报错 -> 再复制报错。而 Vibe CLI 是一个原生的命令行 Agent。它能直接读取你的本地文件结构,理解 Git 状态,甚至帮你执行 Shell 命令。
这意味着你可以直接在终端里对它说:"帮我重构一下 auth.py,顺便把相关的测试文件也改了。"它拥有多文件编辑的能力,不再是"只动口不动手",而是直接对代码库进行手术。对于习惯在 UNIX 环境下工作的开发者来说,这种无需离开终端的体验,确实很"Vibe"。

硬菜上桌:两款模型,两种打法
这次发布的 Devstral 2 家族包含两个版本,刀法精准,分别瞄准了企业级生产力和个人开发者。
1. 旗舰猛兽:Devstral 2 (123B)
这是一头参数量约为 1230 亿的庞然大物。它的定位非常明确:对标目前市面上最强的闭源模型(比如 Claude 3.5 Sonnet)。
- 能力: 拥有 256k 的超长上下文,这意味着它可以一次性吞下整个项目的代码库。在 SWE-bench Verified 基准测试中,它拿下了 72.2% 的高分。这个成绩相当惊人,要知道它是一个开源权重的模型。
- 擅长: 复杂的跨文件重构、架构层面的理解、以及作为 Agent 调用各种工具。
- 注意点: 它的开源协议是 Modified MIT。虽然允许商用,但 Mistral 留了一手:如果你的公司月收入超过 2000 万美元,使用条款会有所限制。这显然是为了防止科技巨头直接白嫖。

2. 桌面小钢炮:Devstral Small 2 (24B)
对于大多数想在本地跑模型的开发者来说,这个 240 亿参数的版本才是真正的甜点。
- 性价比: 它使用了更宽松的 Apache 2.0 协议,完全开源。
- 配置需求: 24B 的大小意味着你不需要拥有 H100 这种核弹级显卡。高端消费级显卡(如 4090)或者 Mac Studio 配合适当的量化,完全可以在本地流畅运行。
- 性能: 别看它小,它在基准测试中达到了 68.0% 的分数。官方宣称它的效率极高,不仅推理速度快,而且在处理多文件编辑时的逻辑并不输给很多大参数模型。
为什么这次发布很重要?
在 Devstral 2 之前,开源编程模型虽然多(比如 DeepSeek 早期版本、CodeLlama 等),但在"Agent"能力上总是差一口气。所谓的 Agent 能力,就是模型不仅要会写代码,还要知道怎么使用工具、怎么自我纠错、怎么在不破坏原有逻辑的情况下修改多个文件。
Mistral 这次直接把"软件工程(SWE)"作为核心训练目标。官方数据显示,Devstral 2 在工具调用和多步推理上的表现非常稳健。这填补了开源领域的一个空白:我们需要一个能真正像"工程师"一样思考,而不仅仅是像"自动补全机器"一样工作的模型。

如何上手?
目前体验这套系统主要有三条路:
- 尝鲜党: 直接去 Mistral 官方平台申请 API,目前有一段免费使用期。这是体验满血版 123B 模型最快的方式。
- 本地党: 既然开源了,Hugging Face 上已经有了权重。如果你有显卡资源,拉取 Devstral Small 2 (24B),配合 vLLM 或者 Ollama(等待社区适配),就能在离线环境下拥有一个强力的编程助手。
- 极客党: 安装
mistral-vibeCLI 工具。只要配置好环境,你就能体验那种"对着终端说话,代码自动生成"的感觉。当然,官方也提醒了,在让 AI 修改核心代码前,最好在一个受控的测试分支里进行,毕竟 AI 偶尔也会"发疯"。
写在最后
Devstral 2 的出现,让开源编程模型的水平又上了一个台阶。它不再满足于代码补全,而是试图接管更复杂的工程任务。
对于个人开发者而言,24B 版本的 Apache 2.0 协议是一份大礼;对于企业而言,123B 版本则提供了一个可以在私有环境部署的强力选项。虽然目前还需要时间来验证它在真实复杂项目中的稳定性,但至少 Mistral 证明了一件事:在代码智能这条赛道上,开源社区依然拥有与闭源巨头叫板的底气。
如果你也对最新的AI信息感兴趣或者有疑问 都可以加入我的大家庭 第一时间分享最新AI资讯、工具、教程、文档 欢迎你的加入!!!😉😉😉
公众号:墨风如雪小站