2023年6月30日,一个叫Shawn Wang的人,网名Swyx,在 Hacker News 上发表了一篇文章。
标题是《The Rise of the AI Engineer》。
文章不长,大概5000字。但它做了一件很重要的事情:它给一群正在做某件事、但不知道自己在做什么的人,起了一个名字。
AI工程师。

在这之前,这些人没有统一的称呼。有人叫自己全栈工程师,有人说自己是产品工程师,还有人干脆就说自己是软件工程师。
他们在业余时间用GPT-3的API做一些有趣的东西,在Discord和Reddit上分享自己的实验,在周末的时候搭建一些小项目。
但他们不知道,自己在做的事情,是一个新的职业。
Swyx在文章里提出了一个概念,叫「shift right」,向右移动。
他说:「我们正在观察到一代人一次的应用AI『右移』。这是由基础模型的涌现能力和开源/API可用性推动的。2013年需要5年时间和一个研究团队才能完成的大量AI任务,在2023年只需要API文档和一个空闲的下午。」
一个空闲的下午。
我第一次看到这句话的时候,停住了。
这不是一个比喻,这是一个事实。那些曾经需要PhD、需要GPU集群、需要几百万美元研究经费的事情,现在一个普通的工程师,在周六的下午,坐在咖啡馆里,用笔记本电脑,就可以做出来。
这是一个什么样的时刻?
文章发表后,迅速在技术社区引发了讨论。
有人在Hacker News上评论说:「终于有人说出来了。我过去一年一直在做这个,但我不知道怎么称呼自己。」
有人在Twitter上转发说:「这就是我。我不是ML工程师,我也不是数据科学家,但我每天都在用AI做产品。」
还有人说:「我们公司的Slack里有一个#discuss-ai频道,里面有20个人,大家都在业余时间做实验。现在我知道了,我们是AI工程师。」
OpenAI的联合创始人、前特斯拉AI总监Andrej Karpathy在推文中回应:「从数量上看,AI工程师的数量可能会远远超过ML工程师/LLM工程师。一个人可以在这个角色中非常成功,而无需训练任何东西。」
无需训练任何东西。
这句话,某种程度上,定义了AI工程师和ML工程师的根本区别。
ML工程师在训练模型。他们调优超参数,改进算法,发表论文。他们的工作是让模型更聪明。
AI工程师在使用模型。他们选择模型,设计接口,优化体验。他们的工作是让模型在现实世界中有用。
这是两种完全不同的技能。

但为什么这篇文章会在2023年6月发表?为什么不是2022年,也不是2024年?
我想了很久,我觉得,这和一个时间点有关。

2022年11月30日,ChatGPT发布。
在此之前,用GPT-3做东西,还是一件相对小众的事情。你需要申请API key,你需要理解temperature、top_p这些参数,你需要花时间调试prompt。只有那些真正对AI感兴趣、愿意花时间研究的工程师,才会去做这些事。
但ChatGPT出现之后,所有人都知道了,原来AI可以这样用。
于是,一切都变了。
那些在业余时间做实验的工程师,突然发现,他们做的事情,不再是小众的爱好,而是一个巨大的机会。那些在Slack频道里讨论AI的团队,突然发现,他们需要把这个非正式的讨论组,变成一个正式的团队。那些在周末搭建小项目的人,突然发现,有公司愿意为他们的技能付钱。
Swyx的文章,就是在这个时刻出现的。
它不是创造了这个职业,而是给这个正在形成的职业,起了一个名字。它不是告诉人们应该做什么,而是告诉人们,你们正在做的事情,有一个名字,有一个身份,有一个未来。
这就是为什么,这篇文章会在2023年6月30日发表。
因为在这之前,这个职业还没有准备好被命名。在这之后,这个职业已经不需要被命名了。
2023年6月30日,是那个恰好的时刻。
我有时候会想,如果没有这篇文章,会怎么样?
也许这个职业还是会出现,也许人们还是会找到彼此,也许市场还是会认可这个技能。但可能不会这么快,不会这么清晰,不会这么有力量。
因为名字很重要。
当你有了一个名字,你就有了一个身份。当你有了一个身份,你就知道自己是谁,你在做什么,你要去哪里。
在2023年6月30日之前,那些在业余时间用GPT-3做实验的工程师,他们是孤独的。他们不知道有多少人在做同样的事情,不知道这件事是否有价值,不知道这条路能走多远。
但在2023年6月30日之后,他们有了一个名字。
AI工程师。
他们不再孤独。
如果你正在使用 AI,正在用它做一些独立产品,或者在公司内部优化一些流程,那么,你就是 AI 工程师。
这是「转型 AI 工程师:重塑你的能力栈与思维模型」专栏的先导文章。接下来,我们会深入探讨 AI 应用工程师的技能栈、工具链、实战案例,以及如何从零开始转型。
这就是流量的力量吗?用豆包 AI 编程做的小红书小组件帖子爆了