2025 年,Vibe Coding(对话式编程)正式从概念走向成熟。这一年,AI 编程从"会补全代码的 Copilot"跨越到"能接管项目的 Agent",开发者与 AI 的协作方式发生了历史性变革------从逐行敲代码,到用自然语言"聊"出整个项目。
这不仅是 Vibe Coding 元年,更是 AI 编程技术生态大爆发的一年:推理模型平民化、Agentic IDE 崛起、Spec 驱动开发成型。让我们回顾这一年的关键技术节点,看看 Vibe Coding 如何重塑软件开发的未来。
一、年度主线:从补全代码到接管项目

用一条主线串起全文:
- 2023--2024 年 :AI 主要做 代码补全 / 问答,更多像"高级自动完成"。
- 2025 年 :AI 开始做 需求理解、任务规划、代码实现、测试、重构 的闭环,变成真正的"虚拟软件工程师"。
- 下半年开始:行业从"聊着写"(Vibe Coding)走向"写完再干"(Spec & Skills 编程)。
全文围绕四条脉络展开:
- 推理模型平民化:o3 / DeepSeek V3 系列。
- IDE 代理人革命:Cursor / Windsurf / Copilot Workspace。
- Spec 驱动开发崛起:Kiro / OpenSpec。
- Skill 驱动 Agent:Claude Skills / Agent Skills。
二、按时间线梳理 2025 关键节点
Q1:推理模型的平民化
关键词:o3-mini、DeepSeek V3、算力普惠
1. 1 月 31 日 -- OpenAI o3-mini 发布
o3-mini 被定位为高效推理模型,在编程竞赛(如 Codeforces Elo)上达到强竞争水平,被视作"日常开发可用的深度思考模型"。 相比早期高延迟的深度推理模型,o3-mini 把"深度思考"拉进了秒级响应,减少了中断心流的等待时间,对 Vibe Coding 体验影响巨大。
2. DeepSeek V3 / R1 带来的价格冲击
DeepSeek V3 在 2024 年底开源并在 2025 年持续演进,提供了在代码任务上极具竞争力的性能,同时保持极低推理成本。 对个人开发者和小团队来说,这意味着可以在代码审查、长文档理解、整仓级重构上"放手用",不再过度担心 Token 花费。
3. Claude 系列的持续迭代
Claude 3.x / 3.5 在 2025 年初仍是代码理解和安全约束方面的标杆,给后来的 Claude 4 系列打下基础。
Q2:IDE 的代理人革命
关键词:Windsurf、Copilot Workspace、o3 / o3-pro
1. 4 月中旬 -- OpenAI o3 & o4-mini 正式登场
o3 被描述为"新一代深度推理模型",在软件工程基准 SWE-bench 等任务上表现突出;o4-mini 覆盖了大量日常开发需求。 这代模型开始原生支持更复杂的函数调用和结构化输出,为 Agent 在 IDE 内做多步计划和执行提供了基础能力。
2. 5 月 -- Windsurf:Agentic IDE 成型
Windsurf(前 Codeium)在 2025 年推出了侧重多步自动化的 Cascade / Turbo 模式,允许 AI 主动读取代码库、规划变更、执行修改,而不仅仅是在单个文件里补代码。 这一设计让"让 AI 修复整个项目的 TypeScript 报错"这类需求变成现实,被称为"Agentic IDE"的重要里程碑。
3. 5 月 30 日前后 -- GitHub Copilot Workspace 面向更多用户开放
Copilot Workspace 把"写代码"抽象成"提出问题 / Issue → 生成计划 → 自动实现 / 提交 PR"的流水线,让开发者更多处于产品与设计决策层,而非底层实现细节层。 对很多团队来说,这是第一次在官方产品中体验"只写需求,不打开编辑器也能出代码"的模式。
4. 6 月 10 日 -- OpenAI o3-pro 发布
o3-pro 作为高端版本,提供更稳定的推理结果和更大的上下文窗口,被 Cursor、Windsurf 等高阶 IDE 集成为"后端大脑"。
Q3:巨头巅峰与 Vibe 平台混战
关键词:Claude 4.1、DeepSeek V3.1、Bolt.new、v0.app
1. 8 月初 -- Claude 4.1 & Claude Code 工作空间
Claude 4.1(及其高端变体)在代码生成、重构和长上下文理解方面表现极强,被不少工程师视为"复杂后端和系统设计首选模型"。 与之配套的 Claude Code 工作空间强调"项目级协作",可对整仓库进行重构、文档生成和测试分析,推动了"在浏览器里完成整套开发闭环"的趋势。
2. 8 月 19 日 -- DeepSeek V3.1 发布
V3.1 在推理质量和代码能力上明显提升,同时保持极具优势的价格,使得其在个人和中小团队中的采用率迅速上升。 大参数量与高效推理结合,使其在很多评测中对闭源商用模型形成有力冲击,也带动了本地和私有部署方案的兴起。
3. Bolt.new vs v0.app:Vibe Coding 平台战火升温
- Bolt.new 主打"全栈生成 + 一键部署",适合从零到一快速搭建可运行产品;
- v0.app 则在高保真 UI 生成和交互设计上更具优势。
很多工程师形成了"缝合流"工作流:用 v0 生成界面,再交给 Bolt 或本地 IDE / Agent 填充业务逻辑。
Q4:完全体智能体与本地生态
关键词:Cursor 2.0、DeepSeek V3.2、Trae IDE
1. Cursor 2.0:Vibe Coding 的终极形态
Cursor 在 2025 年下半年发布了 2.0 版本,引入更强的内置模型(Composer 2.0)以及多智能体并行能力,可以让多个 Agent 在不同分支 / 子任务上同时工作。 借助更好长上下文支持和 Git Worktree 隔离等机制,AI 可以在后台大幅度重构代码而不干扰开发者当前的编辑状态。
2. 11 月 30 日 -- DeepSeek V3.2 发布
V3.2 在工具调用和"显式思考"结合上做了增强,让模型在执行终端命令、API 调用前会进行更清晰的推理和安全检查,降低高风险操作误用概率。 这类设计对"让 AI 真正执行命令"的场景格外重要,是向"可托管 Agent"迈进的一大步。
3. Trae IDE:本地化 Agent IDE 的崛起
Trae 在 2025 年多次更新,强化了与多家模型(如国际大模型与中文生态模型)的集成,并提供项目级协作和代码审查自动化能力。 其在中文语境、国内云平台集成等方面的优化,使其成为国产智能 IDE 阵营中颇具代表性的一个。
三、Spec 编程:从"聊着写"到"写完再聊"
关键词:Kiro、OpenSpec、Spec-Driven Development
1. Kiro:把 Spec 驱动做成产品级 IDE
8 月中 -- Amazon 推出 Kiro:Spec-Driven Agentic IDE
Kiro 被定位为"从原型到生产"的 Agentic 开发平台,核心理念是:先写 Spec,再由 Agent 按 Spec 规划和实现代码。
在 AWS re:Invent 2025 相关分享中,Kiro 被用来演示完整的 Spec-Driven 开发流程:需求 → 规格 → 实现 → 测试 → 部署,全程由 Agent 驱动。
Kiro Specs:把需求写进机器可执行的规格书
Specs 文档将 User Story、接口设计、状态流、验收标准等内容以结构化方式写在一起,既供人类阅读,也供 Agent 解析和执行。
Agent 在 Kiro 中会依照 Spec 拆分任务、生成代码并运行测试,大幅减少"聊着聊着跑偏"的情况,使 AI 更像遵守开发规范的团队成员。
Vibe vs Spec 的典型对比
- Vibe 模式:需求散落在聊天记录里,每次要靠回顾对话找上下文
- Spec 模式:一份可版本控制的 Spec 文件成为单一真相来源(Single Source of Truth),AI 的行为被固化在这份规格之中
2. OpenSpec:把 Spec 抽象成公共"协议层"
8 月起 -- OpenSpec 项目活跃,提出通用 Spec-Driven 框架
OpenSpec 项目旨在为 AI 编程助手提供轻量、可移植的 Spec 定义方式,让各种编辑器和 Agent 共用同一套规格描述。
它采用 Markdown / 文本 + 约定式结构,让 Spec 既可手写,也可由模型生成或修改。
典型工作流:Proposal → Apply → Archive
- Proposal:为某一功能或变更生成机器可读的"开发说明书"
- Apply:AI 助手严格按照 Spec 执行修改、生成代码和测试
- Archive:完成后将 Spec 与变更结果一并归档,成为项目的活文档和审计记录
这一模式被不少开发者视为"为 AI 写 PRD",把 AI 变成真正受规格约束的执行者。
从 IDE 功能到生态基础设施
与 Kiro 内建的 Spec 模式不同,OpenSpec 更像一个跨工具的协议层,使 Cursor、Claude Code、Cline 等多个工具可以共享同样的规格书。
四、Skill 编程:给 Agent 写"行为规格"
关键词:Claude Skills / Agent Skills
如果说 Kiro / OpenSpec 管的是"项目规格(Feature Spec)",那么 Claude Skills 管的就是"行为规格(Behavior Spec / Agent Skills)"。
Claude Skills:可编程的 Agent 小技能
10 月中 -- Claude Skills / Agent Skills 对外可用
2025 年 10 月前后,Claude Skills(又称 Agent Skills)逐步开放给开发者,用于定义 Claude 在特定场景下的可复用行为模块。
初期就有围绕文档处理、自动化报表、创意生成、工作流编排等技能被整理成"Skill 包",形成了面向不同角色的工具集。
Skill 的本质:行为级别的 Spec
一个 Skill 通常包含说明文档(如 SKILL.md)和实现逻辑(脚本、API 配置等),定义了触发条件、输入输出和执行步骤。
当用户发起适配某 Skill 的请求时,Claude 不再靠一次次零散的 Prompt,而是按 Skill 中的流程规范执行,保证行为的一致性和可审计性。
项目规格 vs 行为规格
- 项目规格(Kiro / OpenSpec) :定义"要做什么、做成什么样"
- 行为规格(Claude Skills) :定义"怎么做、按什么流程做"
两者结合后,一个典型流程会变成:先用 OpenSpec / Kiro 写清楚需求,再让具备特定 Skills 的 Claude / IDE Agent 来执行规格。

五、2025 带来的三重认知升级
1. 从 Syntax 到 Semantics
模型已经足够理解语法和框架细节,开发者越来越多把精力放在业务语义、领域知识和产品体验上。
2. Prompt Engineering 已死,Context & Spec 永生
与其纠结一句 Prompt 该怎么写,不如把需求、约束和流程写成可复用的 Spec / Skill,让 AI 在清晰的边界里工作。
3. Vibe Coding 成为日常,Spec & Skills 成为"上线级工程"标配
- Vibe Coding 依旧是探索和原型阶段最爽的方式
- 一旦进入多人协作和生产级项目,Spec 驱动与 Skill 驱动开始成为"让 AI 真正进团队"的基础设施
结语
2025 年,我们见证了 AI 编程从"辅助工具"到"协作伙伴"的历史性跨越。从年初 o3-mini 的发布,到年中 Windsurf、Copilot Workspace 的革新,再到下半年 Kiro、OpenSpec、Claude Skills 的崛起------这一年的每个节点,都在重新定义"编程"这件事的边界。
展望 2026 :如果你的团队还在纠结要不要用 AI,那已经晚了一步。真正的问题是:你要不要为团队建立一套 Spec / Skills 能力栈,让 AI 不只是个聊天机器人,而是一个真正能接管项目、遵守规范的虚拟团队成员?
这不是技术的选择,而是生产力革命的入场券。