大家好,我是 oil 欧呦,真的很久没有写长文章了,这篇文章就讲讲最近的一些思考吧。没有什么逻辑,想到什么就说什么啦。
最近为什么转到 Codex
最近最让我惊喜的产品是 codex,自从 gpt5.5 推出之后,我第一次测试就觉得效果很棒,果断从 claude code 转到了 codex。
其实天下苦 claude 久矣,包括我自己也是。我虽然在 claude 上花了很多钱,也用 claude 做了很多事情,但是 Anthropic 对于中国用户真的是太不友好了。
其实在 claude 的编程能力还不强的时期,我就已经注册了 claude,当时的 claude 还是以文本能力著称,我在同事的安利下用它来做 PRD,但是不久后我同事的账号就被封禁了。早在当时我们就能看到 claude 的风控策略非常严格。
但是当时我们还有选择,我当时看到 claude 的风控策略那么严格,每一次都要挂美国代理才能访问,我就使用了中国的文心一言,当时还没有什么 DeepSeek,百度的模型算是这个行业里面的头部,中文能力相较于 GPT 都有所领先。所以我在当时就订阅了文心一言的会员。
后来 cursor 出现了,搭配 claude 模型颠覆性的编程能力让每一个写代码的人都没办法绕开 Anthropic 这个巨头。时至今日我在 claude 模型上花费肯定过万了,但是我依然没有再使用过我的 claude 账号,也没有订阅过任何 claude 的官方套餐,只能通过中转站或者各种编程工具的套餐来使用。
以 Anthropic 这么激进甚至于癫狂的反华风控策略,目前大家愿意继续订阅 claude 唯一的原因就是因为模型能力强,没有很好的替代品,顶着被恶心的风险去使用依然可以值回票价。
但如果还是这样的策略,一旦市面上有相对来说更加方便的 AI 模型和 AI 产品出现,大家马上就弃暗投明。那对我来说,最近的 codex + gpt 已经完全可以替代 claude + claude code 了,甚至产品体验更好,因为之前我还从来没有用过 claude 的桌面端,因为走的不是官方订阅,所以没法用。
但 codex 的桌面端可以随便下载,不论是 API 还是官方订阅都能用,而且 GPT 5.5 的能力除了上下文长度比较短外,其他方面的能力我觉得跟 Opus 4.7 不相上下,甚至在文字方面还更好一点。再加上 codex 现在还可以直接用 GPT image 2 来生图,整体的产品体验已经超越了 claude code。
而且在用量方面 200 美金的 cursor + opus 4.7 一周都不够用,但是 200 美金的 GPT 订阅直接爽用一个月!目前对我来说,我想不到任何理由再去用 claude。
我是怎么开始为软件付费的
我会觉得现在很多中国开发者对于 AI 了解的片面,很大程度是来自于中国人的付费习惯比较差,其实对我来说也是这样子的,我也是有一个转变的过程的。
我身边的大多数朋友亲戚都是没有任何软件付费的习惯的,中国互联网的生态带给我们的习惯是任何软件都需要是免费的,唯一习惯的付费可能还是各种音乐平台、视频平台的订阅费用。但是这个是为版权付费,而不是为软件使用而付费。
大多数用户没有使用什么 SaaS 产品的习惯,像是一些需要付费的专业软件,大家也都是使用盗版的。比如 PS、office,这是大家从小到大的一个习惯。
那我自己的转变也是从我加入第一家做 SaaS 的公司开始的。以前的我对于海外的软件一无所知,但是由于我们自己的产品是需要出海的,所以我不得不去了解一些海外的 SaaS 产品,当时的我第一个付费的是一个 VPN 软件,一个月要六七十块钱,对我来说已经是特别贵的一个订阅了。但是为了日常工作,我不得不使用。
后面我们的部门负责人有时候会在群里面发起一些 Mac 软件的拼车,比如说 notion,clean my mac,或者其他好用的 SaaS 工具,我也在那期间不断地去体验一些独立开发者的小产品,慢慢地也接受了好的应用是值得付费的这个观念。
这个观念促使着我愿意为当时的文心一言 59 元付费,也促使着我在 Cursor 或者 claude code 出来之后,愿意一个月花大几百块钱去用它们感受当时最强的模型带来的收益。
我有一个好朋友,去年年终的时候离职了,然后一段时间内就在家里面自己学习一些 AI 相关的东西。
后面机缘巧合之下,我有一次去找他玩,他跟我说了他遇到的一些困境,他不知道如何选择 AI 工具,也不知道如何了解一些 AI 的资讯,或者说看了很多 AI 资讯之后自己完全没有头绪怎么把它给用起来。
后面我给了他一些 AI 工具和模型的推荐,希望他能听我的建议把它们用起来,有机会也可以做做视频输出倒逼输入。但是实话说我对很多人都有过类似的建议,但真正听从我的建议去支付听起来很昂贵的 AI 工具的人特别少。
大家都缺乏一个非用不可的契机,也不认为花了几百块钱之后就能对自己的效率有多大提升。但是我这个朋友不一样,他并没有实际的工作效率提升的压力,也不像其他在职的人有稳定的工资收入,但是他听了我的建议去订阅了一些 AI 工具。
当时我推荐的是性价比最高的 windsurf,搭配限时免费的 gpt 5.2 模型,他就这样顺利地开启了自己的 Vibe coding 之路。他绕过了使用垃圾 AI 编程工具+垃圾模型的沮丧之路,绕过了数十款看似纯 Vibe coding 产品的博主推广轰炸,直接走上了一条最正确的路。
体验到了当时顶级 Agent+次顶级模型的能力后,他知道自己也有能力做成一个完整应用,即便他不懂代码。后面一段时间他经常来找我一起 Vibe coding,我们一起探讨 AI 的心得,我给他分享最新的 AI 资讯。
后面观猹要办黑客松,我作为一个从来没参与过黑客松的人对于这种活动还有些期待和仰慕,那种神秘感驱使着我去探索,于是我就试探性地问问他要不要一起去,就当去杭州旅游了。
当时他没怎么犹豫就答应了,我们当即就开始讨论 idea,他甚至为此直接买了一台新的 macbook。我觉得对于一个 gap 期间,新工作还没有眉目,学习 AI 也没有什么明确目标的人,花大几千上万去买一台 macbook,更重要的原因是他愿意在好的工具上投入。
他看到了我在 macbook 上安装配置各种工具都更加方便,各种新的 AI 产品都更愿意先在 mac 上发布,这从后面 openclaw 推出后 mac mini 被疯抢也可见一斑。
后面我们也顺利参加了比赛,做出来了一个虽然没有获奖,但是我们都很满意的一个作品。我们当时做的游戏叫做"猹杀",是一个 AI 狼人杀。
虽然它最后没有获奖,但对我们来说,这个作品已经证明了我们可以靠 AI 在很短的时间里把一个完整的想法落地出来。今天他已经在接一些 AI 相关的项目自己做了。
我为什么愿意用 AI 写代码
讲完了自己最近工具和模型相关的使用情况,再分享一下我自己对 Vibe Coding 和 AI 编程的一些思考吧。
在之前有一段时期,甚至说直到现在,很多人非常抵触 AI 编程,认为 AI 写出来的代码是不稳定、不靠谱的,不知道是出于担心自己被取代,还是单纯守旧、排斥新东西。
对我来说,早期的 AI 代码补全就像我们去配置 typescript 和各种 vscode 插件,为了得到更好更准确的代码提示、代码补全。而 AI 就像一种更加通用、准确、便捷的补全形式,当时它还是受程序员欢迎的。
直到 Agent 出现,它能够自己拆解我们的需求,去写代码,自己 Debug,自己跑测试。这时候反倒大家开始排斥它了。
这其中有一部分原因是大家不愿意付费,用了垃圾的模型,搭配垃圾的工具,得到了一个垃圾的效果,就否定了 AI 编程的全部。另外一方面是程序员这个圈子本来就有鄙视链,用 A 编程语言的,歧视用 B 编程语言的,用这个 A 框架的,歧视那个用 B 框架的,大家都喜欢守着自己的一亩三分地。
我自己对于写代码最大的热情就是它能够帮我创造出东西,那么不论什么语言,什么框架,只要它能够更快地帮我把我想做的东西做出来,那我就会很开心。
AI 出来之后,我可以把更多的时间放到产品设计以及功能打磨上面去,而不是耗在浪费时间的 CRUD 上面。而且我自己本身也会有一些代码洁癖,我希望代码能够精简、低耦合。
但是自己来做这个事情,有的时候一整天下来,代码是清清爽爽了,但是产品功能一点都没变化,这其实也是一种自嗨。那 AI 天然就很擅长做代码重构之类的事情。因为对它来说就是基于已有的业务进行代码调整,不需要它发挥什么创造力,那我自己又可以用清爽的代码,又可以做好用的应用。我当然会非常主动地去使用 AI。
2025 年我发生了什么变化
2025 年,是我变化最大的一年。不论是职业角色还是日常工作流程,都变得和往年大不相同,这其中很大的原因都是因为 AI。AI 不仅重塑了我的工作流程,也迫使我学习了许多新的工具和思维模式。
其实从 2024 年的年初开始,我就体验了一些 AI 编程工具。那时候我就觉得写代码的效率得到了显著的提升,但当时我还是会花大量时间去阅读和理解 AI 生成的代码,以确保它符合项目规范和我的预期。
然而到了 2025 年,AI 的理解能力和上下文保持能力达到了一个新的高度,它生成的代码质量高到我几乎不需要介入修改,这极大地减少了我的代码审查时间。不知道从哪个时刻起,我连一个简单的 CSS 样式调整也不想自己去定位代码位置然后手动修改了。
即使再简单的问题,我也希望通过 AI 来修改,这已经成为了我的固定工作方式。这种依赖性在某种程度上让我感到有点不安,好像我的肌肉记忆正在慢慢退化一样。但另一方面,我确实把大量精力从重复性的编码任务中解放了出来,转而去思考产品设计、业务逻辑的复杂性,以及如何更好地利用这些 AI 工具来解决更多、更大的问题。
我之前是在一个做基础软件的小公司。虽然从去年的年中开始,我就转岗成了产品经理(当时我还在掘金写了一篇文章),但经常还是有些前端需求需要我去辅助开发。其实从我转岗的那个时刻起,我就已经觉得写代码很多时候都是重复性劳动了,我更希望自己参与到产品的设计和决策方面。这并不是说对后续职业发展有多大优势,只是我自己喜欢做这样的事情。
从去年的十二月份开始,我就重度使用 Cursor 进行日常工作的开发。很多事情用 AI 来做,速度特别快。可能以前做一天的一个需求,我在一两个小时内就搞定了,而且不仅把需求开发好了,连测试都自己补上了。
不过严格来说,那时的过程还不算是 "Vibe Coding",我每次都是把非常明确的改动点告诉 AI,它只是帮我做查找代码、修改代码这件简单的事情而已;比较少的时候,我会用它帮我定位 Bug 或优化性能。
由于当时我对 AI 接触得比较多,老板也交给我了一些 AI 相关的调研任务。比如用 AI 结合 GitHub Action 来检查文档站中的错别字、检查应用里的国际化文案,或者研究如何维护一个工作流 MD 文档,以便明确地告诉 AI 怎么实现一个需要重复开发的简单需求。
后面 MCP 爆火,我又为公司开发了两个 MCP 工具,一个是开源的,一个是企业版的,甚至后续还有机会做了一个 MCP 相关的分享。在开发的过程中,我对 AI 相关的基础概念,以及不同的模型、它们的性能、成本、适用场景有了更加深入的了解,知道了怎么样让 AI 更好地调用工具、怎么做上下文管理,也明白了如何设计更稳健的提示词,让整个系统的输出更符合预期。
实话说,虽然我在前司做着一些简单的与 AI 有关的事情,但这都是一些相对比较边缘的场景。我们整个公司的战略路线其实并没有很开放地去接纳 AI,或者说朝着 AI 的方向有非常大的转型,很多 AI 编程工具的订阅都是我自费购买的。
当时的我感受到了 AI 的前景很大,能做的事情有很多,而且也有很多独立开发者自己一个人用 AI 做出了过往可能需要一个团队花很长时间才能做出来的东西。
当时的我还是比较焦虑的。AI 编程虽然能带给我数十倍的开发效率提升,但公司里的需求量并没有多少,很多事情并不是自己一个人就能闭环的。团队内部的其他人没有我对 AI 的了解那么深刻,而且加了 AI 功能也不知道可用性如何,用户也没有明确提出他们需要什么 AI 功能,从战略层面,我就很难去推动这件事情。
Text-Well 和小红书
我很想多做点事情,多做点和 AI 相关的业务。一个真正的转折点是 Claude Code 的问世。当时碰巧我有一个 idea,想做一个 AI 文本纠错润色的工具,于是我买了一个 Claude Code 的订阅。
光靠着下班的时间,我在三天里就把 MVP 版本写了出来,第四天就上线。这个工具后来叫做 Text-Well,也是从那个时候开始,我才真正开始去用小红书。
因为我发现 AI 出现之后,每个人想要做出一个审美不错的应用,成本已经变得非常低了。真正更重要的问题变成了:你的产品怎么被别人看到,怎么分发出去。
所以从那个时候开始,我就觉得自己也应该扩展一下自己的边界,去做一做自媒体,学习怎么把自己做的东西讲清楚、传播出去。这是我第一个彻彻底底一行代码都没写、完全用 AI "Vibe Coding" 出来的一个工具。
我在宣传的过程中,很多人都惊叹于 AI 原来能写这么清爽的样式,能够做出生产可用的应用。很多想了解 Vibe Coding 的人、很多正在使用 AI 编程工具的用户,还有很多很有才华的 AI 初创团队都来私信我,一起沟通开发心得,其中不乏一些大厂的高 Title 成员。
这里插一个小的题外话,在之前我还不怎么玩小红书的时候,我就看到有一些独立开发者,他发布自己的产品被别人抄袭了,其实就是一个简单的 to-do list,但是抄袭他的那个产品,整体的产品交互设计,包括最开始的那些日历的入口,整体的交互布局确实是非常雷同的。而且 UI 还比原作者的设计得更加规整一些。
这一类的产品确实有很多,但是每个用户他自己的使用习惯是不同的。有的用户可能就因为你入口是一个日历,而不是一个列表,他就会选择你这个产品,所以说,类似场景的产品,产品的交互体验和 UI 设计确实也是一些小的创新点。
那我当时也认为这个作者确实被抄袭了,挺难受的,我们应该支持他去维权,但我看到他的评论区简直是不堪入目。很多人都说他做这种东西没有任何护城河,没有任何技术门槛,而且 UI 都做的配色风格不一样,为什么说是抄袭?
当时我就在一条批判他没有护城河的评论底下回复了大致的内容,就像我现在说的一样,我认为产品的一些交互设计,是作者在做的时候,在落地的时候用心思考过的,待办清单这种东西虽然简单,但是也可以体现自己的产品设计思想。
不是每个产品都有护城河的,能有护城河的产品寥寥无几。我现在还留着当时的截图。



当时的开发者也有来跟我私信,说挺感谢我在评论区为他发声辩论的,现在这个独立开发者也转型为一个 AI 博主了。其实我后来越来越觉得,很多之前就在做应用独立开发的人,本身就是更懂产品、更有创造力,也更有订阅习惯的一群人。所以当 AI 出现之后,他们天然会比大多数人更容易把 AI 用起来,也更容易把 AI 变成自己做产品的一部分。
回到我做的那个项目,在写 Text-Well 的过程中,一个偶然的机会,我加入了一个新的做通用 Agent 的公司。不过在这个公司待的时间不是很长,团队氛围我没有那么喜欢,而且做的事情比较混乱,没有明确的方向,所以我在里面只待了两个月就走了。
后面我又加入了现在的团队,主要负责一部分的产品设计、前端开发,之前我还独立负责过网站的 SEO 优化。两个月的时间,我把网站的曝光率稳定地提升了 20 倍,还做了一些 PSEO 的工作。关于这一方面,后续如果效果比较好,我再单独写一篇文章给大家讲我是怎么做的,目前来说,我也只是在实践中学习。所以,现在的我对自己的定位既不是前端工程师,也不是产品经理,可能就是一个更加复合的产品开发工程师吧。
关于技术文章和小红书
以前我很喜欢在解决一些前端的技术问题之后,把自己的解决思路总结成一篇文章。在写文章的过程中,我会重新审视一下自己写的代码是不是足够优雅,解决问题的方式是不是完全正确的。
而且由于写的文章是要面对读者的,所以我自己也会对这个解决思路抱有敬畏之心,不会随便地把不成熟的内容输出给大家。这个过程中,经常发现我的解决方式还有进一步优化的空间,我就一边写文章,一边改进,这促使自己更加深入地理解问题的原因和解决方式。在输出的过程中,促使自己去输入。
但是今年,我已经很少在掘金写技术文章了。因为我自己已经很少手写代码,也没有遇到什么有价值记录的问题------我不需要非常深入地了解某一个问题,就可以解决问题。
我不再关心 Vue 出了什么新版本、有什么新的组件库、前端的八股文又如何迭代了;我更关注的是如何把大模型用起来,怎么用最快的速度跑通一个 LLM 应用的流程,以及一些工程实践。
我分享的都是一些与 AI 相关的概念介绍,以及自己做的产品宣传。我自己之前在掘金写的一些 AI 编程相关的文章不温不火,毕竟在一个传统的技术社区,大家更爱看那些实用的前端和后端干货,不想看自己如何被 AI 替代的焦虑话题。
今年 AI 不仅改变了我的工作方式,同时也给我带来了新的工作机会,让我踏进了一个新的圈子,对自己的能力也有长足的提升。很多人总是悲观于程序员是否会被 AI 取代,但在我的眼中,目前 AI 编程就是一个工具,是一项要掌握的技能。
用前端的话来说,它和 Vue、React 一样是一个技术栈。学会了 Vue 可以取代很多以前写 jQuery 的人,而现在,学会了 AI 编程就可以取代很多不会使用 AI 编程的人。
于是,我自己也转移战场到氛围更加活跃、资讯更加及时的小红书了。后续我在小红书和阮一峰博客进行产品宣传,效果都很棒,虽然我也在掘金写了一篇复盘文章 《🧐 我用 Vibe Coding 从 0 到 1 打造 AI 产品,上线一个月效果如何?有什么心得?》,我觉得写得很好,但是数据很拉胯。
可能现在还有很多人对小红书有刻板印象,其实作为一个受众群体非常广泛的平台,它和 Bilibili 一样------有的人在 B 站看二次元,有的人在 B 站上网课。作为目前非常成熟的社交媒体,小红书的生态也早就不是只有美妆护肤那点事儿了,技术氛围非常好。
我也推荐很多想要了解 AI 资讯,或者想结识更多懂 AI 的大佬可以去小红书发发帖。也正是因为在小红书看到了很多 AI 讨论,我才更明显地感受到,很多人对于 Agent、模型和产品形态的理解其实差异非常大。
我现在怎么看 AI Agent
再说说我对于目前 AI Agent 的一些思考吧。
很多人说 cursor,Manus 这一类产品是套壳,但其实在很早期我就认为模型是基建的一部分,它对于产品来说可能就像以前我们要买个云服务器一样,模型的性能就相当于以前云服务器的性能。
最近关于 Manus 被取消收购的事情又让 Manus 这个产品出现在大家面前,在社交平台里,我能看到 90% 的人都在说 Manus 这个产品被取消收购,扎克伯格一定开心坏了,因为现在小龙虾出现了,Manus 已经是老古董了。
关于 Manus 是否被成功收购这件事我不关心,但是 Manus 的出现,的的确确让我深刻地学习到了 Agent 的设计其实有很多不一样的地方。Manus 对于 Agent 的理解真的很深入。而且上下文工程这个概念也是他们提出来的。
当时我在用 AI Agent 的时候,我就看了很多篇 Manus 对于 Agent 设计的一些心得,一些上下文工程相关的分享,这些让我对于 Agent 这一类产品有了比较深入的了解和思考。
而且时至今日,我也认为 Manus 在通用 Agent 方面做的是非常强的。它有一个非常方便的浏览器扩展,可以直接调用我们默认的浏览器去做一些调研,而且还会自动做分组,Manus 还支持多模态,可以自己去生成图片,而且在产品的交互方面也有一些自己独到的设计,生成的图片可以直接在一个画布里面去查看,PPT 文档和视频也都有自己独立的交互。
这些,我认为都是对于 Agent 上下文输入和产出资产的一种有趣的产品思考,这里面随便一个设计都能单拎出来做成一个产品。
所以我现在也会觉得,AI Agent 还有很多生态可以继续探索。比如上下文和产物的展示方式,现在大家用通用 Agent 看文档,很多时候只是一个普通的 markdown 预览。
但如果把文档、图片、HTML、PPT 这些 AI 生成的产物放到一个画布里,让用户可以批量查看、对比、整理,这本身就是一种很有价值的交互创新。AI Agent 生成的东西越来越多,怎么更好地承载这些产物、组织这些产物、让用户重新进入这些产物,都会变成新的产品机会。
这些设计可能大多数人现在都不知道,在 openclaw 之前,国内大多数非开发人员没有用过 Manus,Genspark,或者其他的通用 Agent,所以大家对于 openclaw 的出现是震惊的,是颠覆的,是恐慌的,大家把早就能在其他 Agent 上做到的事情放到小龙虾上做,甚至很多 AI 大 V 也是如此震惊!"哇,它不仅仅是能跟你对话,而且真的能帮你做事!" 甚至连 skill 这个 Anthropic 推出的概念都变成了 openclaw 的概念了。
关于 OpenClaw 的一些想法
当时我觉得太搞了,但是考虑到大多数人是真的不了解 AI,博主又为了博噱头吃流量,说得夸张点没毛病,但是后来事情朝着更加离谱的方向去了,各种大厂都在搞自己的龙虾套壳产品,甚至政府和国企也是各种政策。
我觉得这件事情最扯的就是大家不是去推动 AI 应用的发展,也不是推动 AI Agent 的建设,而是直接围绕 openclaw 这个开源的、外国的小龙虾产品本身去做各种互动和推广!
openclaw 当然是一个很棒的产品,但是 Manus 的出现推动了大家去了解和开发 Agent,而且 openclaw 的出现则是让大家去套壳 openclaw!而且很多科技大厂都在直接套壳!
对于我来说,Openclaw 的出现对我最大的启发就是 AI Agent 如果有一个非常方便的 IM 工具的入口,能够使得大多数人更方便地去使用它,除此以外,我真的不知道 openclaw 有多大的创新,让此前完全没有做任何通用 Agent 的很多厂商急头白脸地来套壳一波。
我认为 openclaw 的意义是让大厂看到 AI Agent 的一些新的交互可能性,看到 Agent 的前景,挖掘一些围绕 AI Agent 的产品机会。我觉得普通用户因为 OpenClaw 震惊,这件事情当然没有问题。
真正让我觉得可惜的是,很多正在做 AI 相关业务的模型厂商,或者一些原本有资源、有入口、有用户的大厂,在 Manus 出来之后并没有认真思考这些问题:怎么给用户提供更方便的 AI Agent 使用入口,怎么降低用户的上手成本,怎么让 Agent 更自然地进入用户原本的工作流。
结果通用 Agent 在很长一段时间里几乎没有明显发展,等到 OpenClaw 出来之后,大家才突然一片狂欢,甚至开始围绕一个具体产品去套壳。这对于普通用户来说没什么问题,但对于真正做 AI 业务的人来说,是不应该的。
从政府推动政策这件事情来看,我觉得也是类似的逻辑。政府推动 OpenClaw,很大程度上不是因为它真的代表了 AI Agent 的全部未来,而是因为它突然变成了一个足够具体、足够好传播、足够容易写进政策的产业符号。
AI Agent 原本是一个很抽象的方向,但 OpenClaw 把它变成了一个可以部署、可以补贴、可以招商、可以办活动、可以和智能硬件以及"OPC"绑定在一起的抓手。地方政府需要这样的抓手来表达自己没有错过新一轮 AI 产业机会,所以它们会快速围绕 OpenClaw 出政策、做服务、建生态。
但这也说明,很多的政策动作不是建立在对 Agent 产品形态的长期理解之上,而是被一个突然爆火的具体产品牵引着往前走。
国内 Agent 的问题
所以我觉得中国现在其实已经有了很好的模型,很多时候模型能力已经不是最大的限制。真正限制 AI Agent 发展的,反而可能是付费习惯和厂商理解的问题。
Agent 不是一个适合免费用爽的产品,它天然需要长上下文、多轮规划、工具调用和不断试错,成本一定比普通聊天更高。如果用户没有为软件和效率付费的习惯,厂商就很难把最好的模型、最完整的工具链、最稳定的执行体验持续提供给用户。
最后很多产品只能做低价、限量、阉割、套壳,体验自然也很难真正起来。
这也是为什么我觉得很多人对 AI 编程的理解会停留在 token 爆炸、开销爆炸、代码不能上线这些问题上。他们看到的是每一次调用模型的成本,却没有认真算 AI 帮你省下来的时间、试错成本和机会成本。
真正用起来之后,你会发现贵的不是 AI,而是你一直用不好的工具浪费掉的时间。
另外一个问题是,国内很多厂商对 Agent 的理解也不够深。看到 Manus,就学一个通用任务框;看到 OpenClaw,就学一个 IM 入口;看到 Skill,就学一个文件夹规范。
但真正重要的不是这些表层形态,而是它们背后解决的问题:怎么降低用户上手成本,怎么组织上下文,怎么承载产物,怎么让 Agent 进入真实工作流,怎么让用户持续信任它。很多厂商如果自己没有真正高强度使用 Agent,就很难做出真正好用的 Agent 产品。
关于 Skill 的一些想法
其实在 Anthropic 推出 Skill 的时候,类似的现象就有过一次了,当时也是各种博主吹捧 Skill 这个东西是有多大的创新,让之前多少没办法做到的事情现在直接能做到了。
这里又引出另外一个故事,之前我短暂地在一个开发 AI Agent 的公司待了一阵子,当时去参加一个小的分享会,就是关于 Skill 的。在那个分享会上有几个 AI 博主,似乎都是大 V,我也是抱着长见识的心态去听听,因为我自己对于 Skill 也是有所了解。
我想看看这样一个东西有什么值得专门开一个分享会来聊的,是它的渐进式加载理念?还是说大家有什么很棒的 Agent 使用场景用 Skill 包装起来了?
结果去到之后,大家分享的是 Anthropic 官方的那几个 skill,包括 ppt、word 和 excel 的编辑 skill,以及一些前端 UI 设计相关的 Skill。当时在会上,我感觉他们似乎想把市面上所有的 Skill 都讲一遍,似乎这些事情没有 Skill 是完全办不到的。
而在我看来,他们就像是在一个数学加法的分享会上,将类似于 1+1、1+2 这样的所有示例穷举一遍,我当时听得不耐烦就直接打断了。
我说:"我认为 skill 这个概念其实并没有带来 Agent 在能力上实质的拓展,它是一种上下文的封装形式,以前我们也可以通过自己写 markdown 文档或者其他的方式去组织一个工作流或者一些知识,在需要的时候给 Agent 读取,但是 Anthropic 设计了一种目录的规范,用于方便大家统一组织上下文,并且便于这些上下文分发,而且我们可以将不需要用 AI 做的事情提前用程序的方法固化成脚本,Skill 本身最有开创性的是它的渐进式加载,这也是搭配着他们本身 Agent 的产品能力来做的。"
但我说完之后大家好像理解了,然后继续讨论 Skill 如何让 Agent 真正可以去编辑 word 文档...
还有一次是我在小红书看到一个字节的 AI 产品经理也在分享 Skill 的伟大创新,有了 Skill 之后,之前多少大家想做而做不到的事情都能实现了!似乎之前的 AI 都是豆包这种纯对话的应用,没有其他产品能够做到在一个 markdown 里面写一个工作流。
我在评论区表达了相同的看法,我认为 Anthropic 在 AI 相关生态的推动一直是做得很棒的,但是很多事情之前的任何一个通用 Agent 都能做到,cursor 更是早就有了 plan 模式。
以下是我的原话:"我理解 skill 就是一个 claude 自己定义的组织上下文的规范,以文件的方式组织上下文,本质上并没有给 AI 的能力带来什么拓展,和 MCP 做的东西差不多,只是最终的产物是一个包含工作流、数据和脚本的静态压缩包。之所以能够使用这种带有使用流程和相关依赖的组织方式,是因为 AI Agent 的机制使得它可以按照入口文件的描述去一步一步往下执行。如果有用过 cursor 或者 claude code 这种 AI 编程工具的用户,应该早就有写一个 PRD 让它照着去写代码的实践了,claude skill 只是类似于这种 PRD 的一个规范而已,很多实践在没有 skill 的定义之前大家就在这么做了。"
后面原博主也和我在评论区辩论,之所以我当时要回复,是因为原文里面写得太扯淡了,基于 Skill 这个概念,连 multiAgent 已死的结论都得出来了,时至今日那篇文章依然还在: xhslink.com/o/7FLIvbVTJ... ,感兴趣的朋友可以看底下 oil 欧呦也就是我的评论,后续还有很多个回复,相信到了今天可能很多人能看懂我在说的东西了。
另外一个我觉得很值得继续探索的是 Skill 的生态。现在国内 Skill 生态做得其实还比较一般,很多东西还停留在概念传播和简单示例阶段。
比如 Skill 的云端分发、版本管理、审计机制、权限说明、付费机制,这些都还没有真正形成一个成熟的生态。Skill 本身不神秘,但围绕 Skill 怎么组织、怎么分发、怎么验证安全性、怎么让优秀的 Skill 被更多人使用,这些方向都大有可为。
从这些事情发生之后,我就对这些 AI 博主都祛魅了,甚至对于很多大厂的 AI Agent 设计负责人也祛魅了,我相信直至今日还有很多 AI 相关的产品经理对于 AI 的理解都是很局限很片面的。
写到最后
写到这里,我现在其实已经不太想做任何 AI 编程的布道了。因为接受不了的人,经常会在评论区怼我。哪怕我只是分享一个如何节省 token 开销的视频,评论区也会有人说 token 一定会爆炸、开销一定会爆炸、AI 写的代码根本不能合到线上。
我越来越觉得,很多事情只有真正用起来之后才会明白。你如果没有真的把 AI 编程工具放进自己的工作流里,只是站在外面想象它会出什么问题,那讨论很容易变成各说各话。
所以我现在在小红书分享的内容,基本都是默认写给那些已经了解 AI 编程、愿意认真使用 AI 工具的人看的。我不太想花太多时间去说服一个完全不相信它的人,AI 现在到底有多强。
如果一个普通人真的想进入 AI,我觉得最低成本的方式不是看很多资讯,也不是每天追各种模型新闻,而是真正把 AI Agent 用起来,先用它解决一些日常问题。
你要先知道 AI Agent 大概能做什么,哪些工具和模型是领先的,也要先相信 AI 现在已经很强了。只有带着真实问题去用,你才会知道它的边界在哪里,也才会知道自己可以用它做成什么。
经历了这一年之后,我觉得我真正变强的,是对于 AI 的驾驭能力。我也真正有了做社媒的习惯,几乎保持日更,用一个月的时间把小红书做到一万多粉丝,同时还保持着日常工作。
我不希望自己变成一个散播焦虑的 AI 博主,我更希望自己是一个 builder,一个持续分享日常开发经验、工具使用心得和真实思考的人。