2025 Vibe Coding 元年:AI 编程的技术突破全景

2025 年,Vibe Coding(对话式编程)正式从概念走向成熟。这一年,AI 编程从"会补全代码的 Copilot"跨越到"能接管项目的 Agent",开发者与 AI 的协作方式发生了历史性变革------从逐行敲代码,到用自然语言"聊"出整个项目。

这不仅是 Vibe Coding 元年,更是 AI 编程技术生态大爆发的一年:推理模型平民化、Agentic IDE 崛起、Spec 驱动开发成型。让我们回顾这一年的关键技术节点,看看 Vibe Coding 如何重塑软件开发的未来。


一、年度主线:从补全代码到接管项目

用一条主线串起全文:

  • 2023--2024 年 :AI 主要做 代码补全 / 问答,更多像"高级自动完成"。
  • 2025 年 :AI 开始做 需求理解、任务规划、代码实现、测试、重构 的闭环,变成真正的"虚拟软件工程师"。
  • 下半年开始:行业从"聊着写"(Vibe Coding)走向"写完再干"(Spec & Skills 编程)。

全文围绕四条脉络展开:

  1. 推理模型平民化:o3 / DeepSeek V3 系列。
  2. IDE 代理人革命:Cursor / Windsurf / Copilot Workspace。
  3. Spec 驱动开发崛起:Kiro / OpenSpec。
  4. Skill 驱动 Agent:Claude Skills / Agent Skills。

二、按时间线梳理 2025 关键节点

Q1:推理模型的平民化

关键词:o3-mini、DeepSeek V3、算力普惠

1. 1 月 31 日 -- OpenAI o3-mini 发布

o3-mini 被定位为高效推理模型,在编程竞赛(如 Codeforces Elo)上达到强竞争水平,被视作"日常开发可用的深度思考模型"。 相比早期高延迟的深度推理模型,o3-mini 把"深度思考"拉进了秒级响应,减少了中断心流的等待时间,对 Vibe Coding 体验影响巨大。

2. DeepSeek V3 / R1 带来的价格冲击

DeepSeek V3 在 2024 年底开源并在 2025 年持续演进,提供了在代码任务上极具竞争力的性能,同时保持极低推理成本。 对个人开发者和小团队来说,这意味着可以在代码审查、长文档理解、整仓级重构上"放手用",不再过度担心 Token 花费。

3. Claude 系列的持续迭代

Claude 3.x / 3.5 在 2025 年初仍是代码理解和安全约束方面的标杆,给后来的 Claude 4 系列打下基础。


Q2:IDE 的代理人革命

关键词:Windsurf、Copilot Workspace、o3 / o3-pro

1. 4 月中旬 -- OpenAI o3 & o4-mini 正式登场

o3 被描述为"新一代深度推理模型",在软件工程基准 SWE-bench 等任务上表现突出;o4-mini 覆盖了大量日常开发需求。 这代模型开始原生支持更复杂的函数调用和结构化输出,为 Agent 在 IDE 内做多步计划和执行提供了基础能力。

2. 5 月 -- Windsurf:Agentic IDE 成型

Windsurf(前 Codeium)在 2025 年推出了侧重多步自动化的 Cascade / Turbo 模式,允许 AI 主动读取代码库、规划变更、执行修改,而不仅仅是在单个文件里补代码。 这一设计让"让 AI 修复整个项目的 TypeScript 报错"这类需求变成现实,被称为"Agentic IDE"的重要里程碑。

3. 5 月 30 日前后 -- GitHub Copilot Workspace 面向更多用户开放

Copilot Workspace 把"写代码"抽象成"提出问题 / Issue → 生成计划 → 自动实现 / 提交 PR"的流水线,让开发者更多处于产品与设计决策层,而非底层实现细节层。 对很多团队来说,这是第一次在官方产品中体验"只写需求,不打开编辑器也能出代码"的模式。

4. 6 月 10 日 -- OpenAI o3-pro 发布

o3-pro 作为高端版本,提供更稳定的推理结果和更大的上下文窗口,被 Cursor、Windsurf 等高阶 IDE 集成为"后端大脑"。


Q3:巨头巅峰与 Vibe 平台混战

关键词:Claude 4.1、DeepSeek V3.1、Bolt.new、v0.app

1. 8 月初 -- Claude 4.1 & Claude Code 工作空间

Claude 4.1(及其高端变体)在代码生成、重构和长上下文理解方面表现极强,被不少工程师视为"复杂后端和系统设计首选模型"。 与之配套的 Claude Code 工作空间强调"项目级协作",可对整仓库进行重构、文档生成和测试分析,推动了"在浏览器里完成整套开发闭环"的趋势。

2. 8 月 19 日 -- DeepSeek V3.1 发布

V3.1 在推理质量和代码能力上明显提升,同时保持极具优势的价格,使得其在个人和中小团队中的采用率迅速上升。 大参数量与高效推理结合,使其在很多评测中对闭源商用模型形成有力冲击,也带动了本地和私有部署方案的兴起。

3. Bolt.new vs v0.app:Vibe Coding 平台战火升温

  • Bolt.new 主打"全栈生成 + 一键部署",适合从零到一快速搭建可运行产品;
  • v0.app 则在高保真 UI 生成和交互设计上更具优势。

很多工程师形成了"缝合流"工作流:用 v0 生成界面,再交给 Bolt 或本地 IDE / Agent 填充业务逻辑。


Q4:完全体智能体与本地生态

关键词:Cursor 2.0、DeepSeek V3.2、Trae IDE

1. Cursor 2.0:Vibe Coding 的终极形态

Cursor 在 2025 年下半年发布了 2.0 版本,引入更强的内置模型(Composer 2.0)以及多智能体并行能力,可以让多个 Agent 在不同分支 / 子任务上同时工作。 借助更好长上下文支持和 Git Worktree 隔离等机制,AI 可以在后台大幅度重构代码而不干扰开发者当前的编辑状态。

2. 11 月 30 日 -- DeepSeek V3.2 发布

V3.2 在工具调用和"显式思考"结合上做了增强,让模型在执行终端命令、API 调用前会进行更清晰的推理和安全检查,降低高风险操作误用概率。 这类设计对"让 AI 真正执行命令"的场景格外重要,是向"可托管 Agent"迈进的一大步。

3. Trae IDE:本地化 Agent IDE 的崛起

Trae 在 2025 年多次更新,强化了与多家模型(如国际大模型与中文生态模型)的集成,并提供项目级协作和代码审查自动化能力。 其在中文语境、国内云平台集成等方面的优化,使其成为国产智能 IDE 阵营中颇具代表性的一个。


三、Spec 编程:从"聊着写"到"写完再聊"

关键词:Kiro、OpenSpec、Spec-Driven Development

1. Kiro:把 Spec 驱动做成产品级 IDE

8 月中 -- Amazon 推出 Kiro:Spec-Driven Agentic IDE

Kiro 被定位为"从原型到生产"的 Agentic 开发平台,核心理念是:先写 Spec,再由 Agent 按 Spec 规划和实现代码

在 AWS re:Invent 2025 相关分享中,Kiro 被用来演示完整的 Spec-Driven 开发流程:需求 → 规格 → 实现 → 测试 → 部署,全程由 Agent 驱动。

Kiro Specs:把需求写进机器可执行的规格书

Specs 文档将 User Story、接口设计、状态流、验收标准等内容以结构化方式写在一起,既供人类阅读,也供 Agent 解析和执行。

Agent 在 Kiro 中会依照 Spec 拆分任务、生成代码并运行测试,大幅减少"聊着聊着跑偏"的情况,使 AI 更像遵守开发规范的团队成员。

Vibe vs Spec 的典型对比

  • Vibe 模式:需求散落在聊天记录里,每次要靠回顾对话找上下文
  • Spec 模式:一份可版本控制的 Spec 文件成为单一真相来源(Single Source of Truth),AI 的行为被固化在这份规格之中

2. OpenSpec:把 Spec 抽象成公共"协议层"

8 月起 -- OpenSpec 项目活跃,提出通用 Spec-Driven 框架

OpenSpec 项目旨在为 AI 编程助手提供轻量、可移植的 Spec 定义方式,让各种编辑器和 Agent 共用同一套规格描述。

它采用 Markdown / 文本 + 约定式结构,让 Spec 既可手写,也可由模型生成或修改。

典型工作流:Proposal → Apply → Archive

  • Proposal:为某一功能或变更生成机器可读的"开发说明书"
  • Apply:AI 助手严格按照 Spec 执行修改、生成代码和测试
  • Archive:完成后将 Spec 与变更结果一并归档,成为项目的活文档和审计记录

这一模式被不少开发者视为"为 AI 写 PRD",把 AI 变成真正受规格约束的执行者。

从 IDE 功能到生态基础设施

与 Kiro 内建的 Spec 模式不同,OpenSpec 更像一个跨工具的协议层,使 Cursor、Claude Code、Cline 等多个工具可以共享同样的规格书。


四、Skill 编程:给 Agent 写"行为规格"

关键词:Claude Skills / Agent Skills

如果说 Kiro / OpenSpec 管的是"项目规格(Feature Spec)",那么 Claude Skills 管的就是"行为规格(Behavior Spec / Agent Skills)"。

Claude Skills:可编程的 Agent 小技能

10 月中 -- Claude Skills / Agent Skills 对外可用

2025 年 10 月前后,Claude Skills(又称 Agent Skills)逐步开放给开发者,用于定义 Claude 在特定场景下的可复用行为模块。

初期就有围绕文档处理、自动化报表、创意生成、工作流编排等技能被整理成"Skill 包",形成了面向不同角色的工具集。

Skill 的本质:行为级别的 Spec

一个 Skill 通常包含说明文档(如 SKILL.md)和实现逻辑(脚本、API 配置等),定义了触发条件、输入输出和执行步骤。

当用户发起适配某 Skill 的请求时,Claude 不再靠一次次零散的 Prompt,而是按 Skill 中的流程规范执行,保证行为的一致性和可审计性。

项目规格 vs 行为规格

  • 项目规格(Kiro / OpenSpec) :定义"要做什么、做成什么样"
  • 行为规格(Claude Skills) :定义"怎么做、按什么流程做"

两者结合后,一个典型流程会变成:先用 OpenSpec / Kiro 写清楚需求,再让具备特定 Skills 的 Claude / IDE Agent 来执行规格。


五、2025 带来的三重认知升级

1. 从 Syntax 到 Semantics

模型已经足够理解语法和框架细节,开发者越来越多把精力放在业务语义、领域知识和产品体验上。

2. Prompt Engineering 已死,Context & Spec 永生

与其纠结一句 Prompt 该怎么写,不如把需求、约束和流程写成可复用的 Spec / Skill,让 AI 在清晰的边界里工作。

3. Vibe Coding 成为日常,Spec & Skills 成为"上线级工程"标配

  • Vibe Coding 依旧是探索和原型阶段最爽的方式
  • 一旦进入多人协作和生产级项目,Spec 驱动与 Skill 驱动开始成为"让 AI 真正进团队"的基础设施

结语

2025 年,我们见证了 AI 编程从"辅助工具"到"协作伙伴"的历史性跨越。从年初 o3-mini 的发布,到年中 Windsurf、Copilot Workspace 的革新,再到下半年 Kiro、OpenSpec、Claude Skills 的崛起------这一年的每个节点,都在重新定义"编程"这件事的边界。

展望 2026 :如果你的团队还在纠结要不要用 AI,那已经晚了一步。真正的问题是:你要不要为团队建立一套 Spec / Skills 能力栈,让 AI 不只是个聊天机器人,而是一个真正能接管项目、遵守规范的虚拟团队成员?

这不是技术的选择,而是生产力革命的入场券。

相关推荐
掘了10 小时前
「2025 年终总结」在所有失去的人中,我最怀念我自己
前端·后端·年终总结
寻找奶酪的mouse15 小时前
30岁技术人对职业和生活的思考
前端·后端·年终总结
海石19 小时前
去到比北方更北的地方—2025年终总结
前端·ai编程·年终总结
哈里谢顿1 天前
Vibe Coding 中的 Skills 详解
vibecoding
横木沉6 天前
Opencode启动时内置Bun段错误的解决笔记
人工智能·笔记·bun·vibecoding·opencode
数字游民95279 天前
半年时间大概上了70个web站和小程序,累计提示词超过20w
人工智能·ai·小程序·vibecoding·数字游民9527
编程武士16 天前
Github 开源项目 Spec Kit 介绍:让你的 Vibe Coding 更加稳定
github·vibecoding
颢珂智库Haokir Insights17 天前
如何把 MCP 接入到文档 / Issue / CI,形成可复用的工程外脑
服务器·人工智能·ai编程·vllm·vibecoding
公众号: 江南烟雨中17 天前
2025年终总结:非宁静无以致远
程序人生·年终总结·程序员思维
陌陌62320 天前
10 天 AI 协作开发实录:一份可复用的 AI 开发流程样例
人工智能·ai开发·vibecoding