编程 Agent 赛道的开放程度超出了我的预期。6 月 11 日小米开源了 MiMo Code(MIT 协议),6 月 12 日月之暗面开源了 Kimi K2.7 Code。加上生态里已有的 Claude Code、Cursor 和 OpenCode,2026 年的 AI 编程 Agent 格局正在快速成型。
这些工具的共同特点是不再满足于自动补全代码,而是通过 Terminal 权限、跨文件上下文管理和自主任务拆解,试图接管从需求到跑通的完整闭环。但不同方案背后,设计思路的分歧比想象中大。
Agent 编程的三条技术路径
目前市面上编程 Agent 的架构设计有三条不同路线,理解它们的差异是选型的第一步。
第一条:Terminal 原生 Agent。Claude Code 和 MiMo Code(基于 OpenCode)都属于这一类。它们运行在终端中,通过标准 I/O 与开发者交互,直接操作文件系统和 Git 工具链。这类 Agent 的优势是完整的环境控制权 ------能自主执行 npm test、git diff、grep 等命令,形成开发闭环。

第二条:IDE 集成插件。 Cursor 为代表。Agent 嵌入编辑器中,通过编辑器 API 操作文件,访问 VS Code 扩展生态。优点是有图形界面和可视化 diff,适合不习惯命令行的开发者。但受限于编辑器沙箱,对系统级操作的控制力不如 Terminal Agent。
第三条:轻量对话型。 Kimi K2.7 Code 当前介于二者之间。它能理解项目结构并生成代码块,但 Shell 命令调用和自闭环执行还在完善中。
MiMo Code:小米开源的终端 Agent
MiMo Code 在 6 月 11 日凌晨发布,采用 MIT 协议开源,基于 OpenCode fork 构建。它的几个设计决定值得关注:
技术架构:用 Bun + TypeScript + Effect 实现,终端 UI 用 SolidJS 渲染,桌面端用 Tauri 构建。这套技术栈的选择意味着小米团队比较注重跨端体验和响应速度。
核心能力:
bash
# MiMo Code 基本用法
# 启动交互式终端
mimo
# 直接提问
mimo "实现一个带 LRU 缓存的日志采集器"
# 修改代码并测试
mimo "修复这个模块的内存泄漏"
MiMo Code 的真正亮点是持久化记忆系统。它能在多次会话间保持对项目的深度理解,这意味着第 2 次使用时不需从头解释项目结构。
限时免费策略:内置的 MiMo-V2.5 模型目前完全免费调用,支持 100 万 token 上下文。结合 MIT 开源协议,开发者可以自由定制、二次分发,甚至换成其他后端模型(兼容 DeepSeek、Kimi、GLM 等 API)。
更有意思的是,小米并没有将 MiMo-V2.5 模型严格锁死在自家工具里。社区已经有人从 MiMo Code 中提取出了 MiMo Auto 模型,可以在其他工具中直接调用它的 API。这种开放的姿态在 AI 编程工具中比较难得。
Kimi K2.7 Code:开源的编程模型
月之暗面在 6 月 12 日开源了 Kimi K2.7 Code,这是一个专门针对编程场景优化的模型。企业内外部基准测试显示,它在多项编程任务中比 K2.5 有较为明显的提升。
K2.7 Code 的用法比较灵活:
python
# 用 HuggingFace Transformers 加载 Kimi K2.7 Code
from transformers import AutoModelForCausalLM, AutoTokenizer
model_name = "moonshotai/Kimi-K2.7-Code"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForCausalLM.from_pretrained(
model_name,
torch_dtype="auto",
device_map="auto"
)
prompt = "用 Python 实现一个支持并发的日志写入器"
inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
outputs = model.generate(**inputs, max_new_tokens=2048)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))
月之暗面预告了 6 倍速高速版将在下周一上线,值得关注。
Claude Code:当前功能最完整的 Agent
Anthropic 的 Claude Code 是 Terminal Agent 路线的先行者。它在 2025 年 12 月以早期预览版推出后,经过多次迭代,目前在企业级开发场景中应用比较成熟。
Claude Code 的 agent 特性主要体现在这几个方面:
bash
# Claude Code 的核心 agent 能力------自动识别并修复
# 修改代码后自动运行测试,失败则自行分析并修正
claude "重构这个支付模块,保持接口兼容"
# 自主排查构建错误
claude "build 报错了,帮我排查并修复"
# 它会自主运行 npm run build → 读报错 → git log → 修正代码 → 重新构建
GitHub 博客在几天前分享了一篇文章,讲他们如何让 Copilot CLI 的委派行为更精准------这说明大厂也在摸索 Agent 的自主动作边界,选择不等同于全权委派。
Cursor:IDE 深度集成
Cursor 走的路线和上述 Terminal Agent 不同。它选择深度嵌入编辑器体验,同时在 2026 年开始逐步引入 Agent 能力(如自动运行测试、终端命令建议)。
Cursor 的优势在于可视化:代码变更以 diff 形式展示,开发者可以直接确认或回滚。对于前端工程师和不喜欢 CLI 的开发者来说,这种交互模式的学习成本更低。
选型参考:不同场景的匹配
追求稳定性和生态成熟度 → Claude Code 功能最完整,社区资源最多,企业级 CI/CD 集成经验丰富。适合对英语上下文敏感的资深工程师。
需要零成本启动、二次开发 → MiMo Code MIT 协议、限时免费模型、可换后端 API。适合预算敏感的小团队,或者想做二次定制的企业。注意项目刚发布两天(v0.1.0),API 和配置可能还在变化。
需要强中文理解和对话式辅助 → Kimi K2.7 Code 中文注释和业务逻辑的理解能力在开源模型中表现突出。适合本地部署、对数据隐私有要求的团队。
偏好 IDE 体验、前端开发为主 → Cursor 可视化 diff 降低试错成本,IDE 集成让不习惯终端的开发者也能上手。
想自己搭 Agent 工具链 → OpenCode MiMo Code 就是基于它二次开发的。自由度高,可以自定义工具的调度策略。
开源 vs 商业的博弈
2026 年 6 月的这波开源潮值得注意。两周之内,小米和月之暗面都选择把编程 Agent / 模型开源出来。这意味着 AI 编程工具的生态正在从「几家商业工具垄断」走向「基础能力开放、增值服务收费」的格局。
开源带来的直接影响是:小团队和个人开发者不再被单一工具的定价模型绑定。MiMo Code 的 MIT 协议允许自由修改和再分发,Kimi K2.7 Code 的模型权重完全开放------这种组合给了开发者充分的组合自由。
核心提醒是,选编程 Agent 本质上是在选「你愿意把多少工程决策权交给 AI」。终端 Agent(Claude Code / MiMo Code)权限更大、闭环更深,但出错时的后果也更重,适合有代码审查流程的团队;IDE 插件(Cursor)权限更受限,但更容易人工介入和修正,适合单人/小团队快速验证。开源方案(MiMo Code、Kimi K2.7 Code)的加入让选型从「哪家最好」变成了「哪条路线最适合你当前的工作流」------先确定自己团队的委派策略和预算约束,再挑工具,思路会更清晰。