Devin:从"取代你的AI程序员"到"AI不会取代人类"——这家CEO的嘴,比AI还快


第一幕:造神

2024 年 3 月,一条 4 分钟的 demo 视频让整个程序员群体集体失眠了。

视频里,一个叫 Devin 的 AI 正在写代码。不是那种 Copilot 式的自动补全,也不是 ChatGPT 式的问答,而是真正的------从头到尾,独立干活。给它一个 GitHub issue,它自己打开浏览器查文档,自己写代码,自己跑测试,自己 debug,自己提 PR。全程无人干预。

Cognition 的 CEO Scott Wu 在发布会上说了一句话,后来被截成了无数短视频的标题:

"Devin is the world's first AI software engineer."

世界第一个 AI 软件工程师。

这句话的潜台词,所有人都听懂了:你,可以被取代了。

当天晚上,我的朋友圈炸了。有人截图配文"完了,我要失业了",有人转发说"赶紧学点别的吧",也有人冷笑一声说"又一个 PPT 公司"。但更多的人,是沉默的。那种沉默,不是不屑,是恐惧。

Devin 一夜之间成了科技圈的顶流。Hacker News 的头条、Twitter 的热搜、36 氪的快讯------所有技术媒体都在讨论同一个问题:程序员真的要被 AI 取代了吗?

Cognition 的创始团队也够硬。Scott Wu 和他弟弟 Neal Wu,都是顶级竞赛编程选手,之前在 Jane Street 和 Hudson River Trading 这种量化交易公司待过。这种背景意味着什么?意味着他们不是那种"AI 布道师"式的创业者,他们是真的会写代码的人

这让 Devin 的可信度又上了一个台阶。

一个月后,2024 年 4 月,Cognition 完成了 2100 万美金的 A 轮融资,估值 2 亿美金。Founders Fund 领投,Khosla Ventures 跟投。对于一个刚发布 demo 的公司来说,这个估值已经很高了。但投资人觉得值------因为他们买的不是产品,是"取代程序员"这个故事。

故事比产品值钱。

这就是 AI 圈的第一定律。


第二幕:扒皮

但造神这件事,从来都有一个副作用------神是不能犯错的

Devin 发布后不到两周,就有人开始扒皮了。

最先动手的是社区里那帮较真的开发者。他们拿着 Devin 的 demo 视频,一帧一帧地看,一个操作一个操作地复现。然后他们发现了一些有意思的事情。

Devin 在 demo 里修复的那个 GitHub issue,其实是一个已经被人工修复过的旧 issue。 也就是说,Devin 的"独立修复",本质上是在抄标准答案。就像一个学生考试的时候偷偷看了同桌的卷子,然后交卷说"我全做对了"。

更要命的是,有人让 Devin 去处理一些真正的编程问题------不是那种 demo 里精心挑选的简单 issue,而是真实的、复杂的、有历史包袱的代码。结果 Devin 的表现,用一句话说就是:

翻车翻得比翻书还快。

基本的逻辑推理搞不定,多文件协作搞不定,稍微复杂一点的 bug 就卡住了。有人做了一组对比测试:同样的 10 个编程任务,Devin 的通过率大概只有 14%,而一个普通的人类程序员,通过率是 90% 以上。

14% 对 90%。

这就是"世界第一个 AI 软件工程师"的真实水平。

但 Cognition 不在乎。因为 Devin 的故事已经讲出去了,钱已经融到了。接下来要做的事情很简单:把产品做出来,让数字好看一点,然后继续融更多的钱。

2024 年底,Devin 正式对外开放。定价 500 美金/月。

500 美金一个月。你知道这个价格意味着什么吗?它意味着 Devin 不是给你用的,是给企业用的。一个年薪 30 万的程序员,月薪大概 2.5 万。500 美金折合人民币大约 3600 块,相当于程序员月薪的 15%。如果 Devin 能替代 15% 的工作量,那就回本了。

问题是,Devin 能替代 15% 吗?

从用户的反馈来看,大部分人的回答是:不能。 Devin 在简单任务上还行,但一旦涉及到真实的业务逻辑、复杂的系统交互、遗留代码的理解,它就变成了一个需要你不断擦屁股的"初级实习生"。你花在指导 Devin 上的时间,可能比自己写还多。

但故事还在继续。


第三幕:膨胀

2025 年,Cognition 完成了 B 轮融资。估值 10 亿美金,独角兽了。

然后是 C 轮。估值 30 亿美金。

到 2026 年 5 月,最新一轮融资完成,估值 260 亿美金。累计融资 21 亿美金。

21 亿美金。

你知道 21 亿美金是什么概念吗?这笔钱,够买下三家 A 股上市的中型软件公司。够在中国的一线城市买 3000 套房子。够给全中国的程序员每人发 100 块钱------虽然这听起来不多,但考虑到中国有 800 万程序员,那也是 8 个亿。

而 Cognition 用这笔钱做了什么?

答案是:做 Devin,然后收购 Windsurf。

2026 年 5 月,Cognition 宣布收购 Windsurf------就是那个由 Codeium 改名的 AI 编程工具。Windsurf 当时有大概 200 个员工,在 AI 编程领域也算是一个有竞争力的产品。

收购的消息出来的时候,很多人以为 Cognition 要搞"强强联合"。Devin 做 Agent,Windsurf 做 IDE 插件,两者打通,天下无敌。

然后,事情就开始变得有意思了。

收购完成后第一周,Windsurf 团队有 30 个人被直接裁掉了。没有预警,没有缓冲,当天走人。

第二周,剩下的大约 170 人也陆续收到了通知:要么接受遣散方案走人,要么留下来,但要接受新的工作条件。

什么工作条件?

每周工作 80 个小时以上。

你没看错。80 个小时。一周 7 天,平均每天 11.4 个小时。没有周末,没有休息日。

一家号称要用 AI 取代程序员的公司,正在用最原始、最暴力、最"人力密集"的方式压榨自己的程序员。

我不知道该用什么词来形容这种讽刺。

也许该这么说:Devin 确实取代了程序员------它取代的是 Windsurf 那 200 个程序员的工作岗位,然后让剩下的人加倍干活。

这让我想起一个段子:

老板买了一台机器人,跟员工说:"这台机器人能干三个人的活!"

员工很高兴:"太好了,那我们可以减少工作时间了吧?"

老板说:"不,你被开除了。剩下的人要干三个人的活。"

Cognition 把这个段子,变成了现实。


第四幕:塌方

2026 年 5 月,就在 Windsurf 收购的同一时期,Scott Wu 接受了一次采访。

在这次采访中,他说了一句让所有人目瞪口呆的话:

"AI coding tools should not replace humans."

AI 编程工具不应该取代人类。

我反复看了好几遍这句话的原文,确认自己没有看错。

世界第一个 AI 软件工程师。取代你的程序员。让你失业。让你焦虑。让你半夜刷到这条新闻的时候心跳加速。

------这一切的始作俑者,现在亲口说,AI 不应该取代人类。

你知道这种感觉像什么吗?

就像一个人靠卖"减肥药"发了财,然后有一天告诉你:"其实减肥最重要的是管住嘴迈开腿,药没什么用。"

就像一个人靠卖"焦虑课程"买了三套房,然后有一天告诉你:"其实人生不需要焦虑,慢慢来就好。"

就像一个人靠"取代程序员"的故事融了 21 亿美金,然后告诉你:"AI 不应该取代程序员。"

你钱都融完了,才来说这句话?

Scott Wu 在采访中解释了为什么改口。他说,Devin 的定位已经变了。最初的愿景是做"全自动 AI 程序员",但现在发现,更有效的方式是做"AI 辅助工具",帮助人类程序员提高效率,而不是取代他们。

他还透露了一个数据:Cognition 内部 89% 的代码是 Devin 生成的。

89%。

这个数字很吓人。但你仔细想想,这个数字到底说明了什么?

它说明 Devin 确实在写代码------但它是给 Cognition 自己写代码。Devin 写的是 Cognition 的产品代码,不是在替外部客户写代码。换句话说,Devin 的最大客户,是它自己的公司。

这让我想起另一个经典的商业现象:很多"革命性产品"的最大用户,就是它自己。Notion 最大的客户是 Notion 自己,Slack 最大的用户是 Slack 自己,而 Devin 最大的客户,是 Cognition 自己。

当一个产品只能自产自销的时候,你就知道它的 PMF(Product-Market Fit)有多尴尬了。


这 21 亿美金,到底买了什么?

让我们算一笔账。

Cognition 累计融资 21 亿美金,估值 260 亿。公司大概 200-300 人(算上 Windsurf 遣散后剩下的人)。

按照 AI 公司的一般成本结构来估算:

  • 人力成本:300 人,平均年薪 30 万美金(硅谷 AI 工程师的行情),一年就是 9000 万美金。
  • 算力成本:Devin 是重度 Agent,每次运行都要调用大模型进行多步推理,算力消耗远超普通 AI 应用。保守估计一年 1-2 亿美金。
  • 运营成本:办公、法务、市场、行政,一年 3000-5000 万美金。

加在一起,Cognition 一年的运营成本大概在 3-4 亿美金 左右。

21 亿美金的融资,大概够烧 5-6 年。

但问题是:收入呢?

Devin 的定价是 500 美金/月。假设它有 5000 个付费用户(这已经是一个乐观的估计了),一年收入就是:

500 × 12 × 5000 = 3000 万美金

3000 万美金的年收入,对比 3-4 亿美金的年成本。收入只能覆盖成本的 8%-10%。

剩下的 90%,全靠融资续命。

这就是 AI 独角兽的真实面貌:不是商业公司,是一台烧钱机器。 投资人不断往里面加钱,它不断往外冒热气,至于产出------产出是什么?产出是"故事"。

故事讲得好,估值就涨。故事讲崩了,就改口说"AI 不应该取代人类",然后换个故事继续讲。


Windsurf 的 200 个人,做错了什么?

让我们把视角从 Cognition 的高层拉下来,看看 Windsurf 那 200 个普通员工的故事。

Windsurf 的前身是 Codeium,一个做 AI 代码补全的创业公司。在 AI 编程工具的赛道上,Codeium/Windsurf 一直被认为是 Copilot 的有力竞争者。产品做得不差,用户反馈也不错,团队规模从几十人扩张到了 200 人。

然后 Cognition 来了。

260 亿美金估值的独角兽,要收购你。

你以为是强强联合?你以为是大树底下好乘凉?你以为终于可以拿到大厂的资源和福利了?

不,你以为的,都是错的。

收购完成后,Windsurf 的品牌名被迅速淡化。团队被拆散。30 个人第一天就被裁了。剩下的人被告知:要么走,要么接受 80 小时工作周。

这些人做错了什么?

他们做了一个好产品。他们建了一个有竞争力的团队。他们吸引了独角兽的注意。然后他们被"人才收购"了------这个词在硅谷叫 "acqui-hire",意思是"我买的不是你的产品,是你的人"。

但"人才收购"的真相是:我买了你的人,然后让大部分人走,只留几个核心。 那 200 个人里,最终可能只有 20-30 个人会被留下来,其他的都是"附带损害"。

这就是 AI 时代的人才逻辑:你不是资产,你是成本。只有在被收购的那一瞬间,你才是"人才"。收购完成后,你就是"冗余"。


一个更深的问题:为什么 Devin 活成了自己最讨厌的样子?

如果我们把 Devin 的故事从头到尾拉一条线,会发现一个诡异的弧线:

2024 年 :Devin 是"世界第一个 AI 软件工程师",要取代你。 2025 年 :Devin 变成"AI 编程助手",和你协作。 2026 年:Scott Wu 说"AI 不应该取代人类",Devin 变成了它当初最看不起的"辅助工具"。

从"取代你"到"辅助你",从"全自动"到"半自动",从"世界第一个 AI 工程师"到"又一个 Copilot"。

Devin 活成了自己当初最瞧不起的样子。

为什么会这样?

因为"取代人类"这个故事,从一开始就是假的。

不是说 AI 不能写代码------它当然可以。但"写代码"和"当工程师"之间,隔着一道巨大的鸿沟。这道鸿沟里填满了:对业务的理解、对系统的判断、对历史债务的处理、对团队协作的感知、对风险的预判......这些东西,不是训练数据能解决的。

AI 可以做 80% 的"编码"工作,但做不了 20% 的"工程判断"。而那 20%,恰恰是最值钱的部分。

所以 Devin 的叙事塌方,不是技术失败,是叙事失败。

它高估了 AI 的能力,低估了"工程师"这个角色的复杂性。当它发现 AI 做不了"工程师"的时候,只能退回到"辅助工具"的位置。但"辅助工具"这个故事,不值 260 亿美金------Copilot 的故事,只值 50 亿。

所以 Scott Wu 必须不断改口、不断调整叙事、不断重新定义 Devin 是什么。因为如果他不改口,投资人就会问:你说要取代程序员,怎么现在变成辅助工具了?那我的 260 亿估值怎么解释?

这就是 AI 创业最残酷的地方:你的故事一旦讲出去,就不能回头了。但你又不得不回头。


Devin 的对手们:一个比一个卷

在 Devin 变形的同时,AI 编程赛道的其他选手也在疯狂内卷。

Cursor,一个基于 VS Code 魔改的 AI 编程 IDE,2024 年突然爆火。它的思路很简单:不搞全自动 Agent,就在你写代码的时候给你实时建议。Copilot 做的是"补全",Cursor 做的是"对话"------你可以直接告诉它"把这个函数重构一下",它就帮你改了。体验丝滑得让人上瘾。

到 2025 年底,Cursor 的年收入已经突破了 1 亿美金。注意,是收入,不是估值,不是融资额。1 亿美金的 ARR(Annual Recurring Revenue),这意味着它有真实的付费用户,有真实的商业模型。

相比之下,Devin 的 500 美金/月定价,更像是给投资人看的"高客单价"------但高客单价不代表高收入。你定价 500 块,没人买,收入就是零。Cursor 定价 20 美金/月,但有几十万用户,收入就是 Devin 的几十倍。

GitHub Copilot 就更不用说了。微软亲儿子,背靠 GitHub 的开发者生态,2025 年已经有超过 1000 万付费用户。它不需要讲故事,因为它不需要融资------它的"投资人"就是微软,而微软不需要故事来证明自己的判断。

还有 Claude Code (Anthropic 出品的命令行编程工具)、Amazon Q (AWS 的 AI 编程助手)、Google 的 Jules(又一个 AI 编程 Agent)......

这个赛道已经拥挤到了什么程度?随便打开一个技术社区的首页,都能看到"又一个 AI 编程工具发布"的新闻。

在这样一个赛道里,Devin 的处境就非常尴尬了:

  • 和 Cursor 比:Cursor 体验更好、价格更低、用户更多。Devin 没有优势。
  • 和 Copilot 比:Copilot 有微软的流量和生态加持,Devin 没有。
  • 和 Claude Code 比:Claude Code 背后的 Claude 4 模型,在编程能力上可能比 Devin 自己的模型更强。Devin 也没有优势。

Devin 唯一的优势,就是"故事"。 "世界第一个 AI 软件工程师"这个故事,足够性感,足够有传播力,足够让投资人掏出 21 亿美金。

但故事不能当饭吃。当竞争对手们都在用产品说话的时候,Devin 还在用 PPT 说话------这就很危险了。

这不只是 Devin 的问题

如果你以为这只是 Devin 一个产品的问题,那你就太天真了。

Devin 的叙事变形,只是 AI 行业的一个缩影。

看看这两年的 AI 产品:

  • Humane AI Pin:融资 2.3 亿,号称要取代手机,结果 1.16 亿卖给了 HP。连融资额都没卖回来。
  • Rabbit R1:CES 上风光无限,首日卖了 1 万台,结果被扒皮是个 Android 套壳,日活只有 5000。
  • Jasper AI:估值 15 亿的 AI 写作工具,ChatGPT 一出来就没人用了,收入腰斩,裁员过半。
  • Stability AI:开源 AI 独角兽,估值 10 亿+,烧光三轮融资,CEO 跑了。
  • Character.AI:AI 聊天机器人,因为一个 14 岁男孩的自杀事件被推上法庭。

这些产品的共同特点是什么?

它们在"讲故事"阶段都是满分,在"做产品"阶段全部不及格。

AI 行业现在面临的不是技术问题,是"故事-产品"的断裂带。投资人为故事买单,用户为产品买单,而这两者之间的差距,就是 AI 公司的坟墓。


最后一个问题

Devin 没有死。它融资 21 亿美金,估值 260 亿,活得比大多数 AI 公司都好。

但它"变形"了。

从"取代你的 AI 程序员"变成了"辅助你的 AI 工具"。从"世界第一个"变成了"又一个"。从"让你失业"变成了"和你协作"。

这种变形,比死亡更令人深思。

因为它证明了一件事:在 AI 时代,最不值钱的就是"AI 能取代人类"这个故事本身。

那些靠这个故事融到大钱的公司,最终都会发现,它们不得不花更多的钱和时间,来证明"AI 其实不能取代人类"。

而这个"证明"的过程,就是它们从"改变世界"退化到"苟且偷生"的过程。

Scott Wu 的嘴确实比 AI 还快。2024 年他说"取代",2026 年他说"不取代"。两个词之间隔了两年时间,和 21 亿美金。

这 21 亿美金,买到的最贵的一课,大概就是这四个字:

别吹太大。


相关推荐
浩风祭月1 小时前
AI 改代码总爱顺手重构?一份 Task Contract 把修改范围锁住
ai编程·claude·cursor
大志说编程1 小时前
Agent面试真题06: 十分钟带你快速掌握Agent记忆管理高频面试题(附详细答案)
后端·面试·ai编程
葡萄城技术团队1 小时前
从提示词工程到 Harness Engineering:打造坚实可靠的 AI 开发系统
ai编程
用户61635661811041 小时前
手搓AI工作流:让AI从“野马“变“战马“
ai编程
玄星啊1 小时前
AI 编程的第 30 天,我怀念古法 Coding 了
前端·ai编程
唐老板1 小时前
给AI加了3条规则,SQL翻车率降了
ai编程
深蓝AI1 小时前
Claude Code 子智能体实战:让 AI 自己调 AI 来写代码
ai编程
ServBay1 小时前
Claude Code 被曝植入后门,AI 时代如何安全打造本地 DevOps
后端·ai编程·claude
threerocks4 小时前
Fable + GPT Image = 无敌,Claude Code 中使用 Codex(订阅)生图的方案
aigc·ai编程
刘棕霆4 小时前
29—AI Skill 测评集如何保持有效:从线上负反馈到 regression 用例
aigc·ai编程·测试