一些highlight
我们的目标不是让用户尽可能长时间留在产品里。我们的目标是帮助你解决长期问题和目标。这往往意味着:你应该在产品里花更少的时间。
订阅、广告、电商都是chatgpt可能的商业化路径。你不会上网买车买房,但你可能会和 ChatGPT 聊买车买房
正文
我是 Alex Heath,《The Verge》的副编辑,也是这期周四节目的临时主持人。今天我将和一位特别的嘉宾对话:Nick Turley,他是 OpenAI 旗下 ChatGPT 的负责人。
虽然 Sam Altman 无疑是公司对外的公众面孔,但从一开始,Nick 就一直在主导 ChatGPT 的开发。如今它已经成为有史以来增长最快的软件产品,每周触达 7 亿人。
Nick 其实并没有接受过很多采访。我原本准备了不少话题,但就在上周 GPT-5 发布后发生了一件意想不到的事:人们居然非常怀念上一个模型 GPT-4o,以至于公司很快又把它重新上线了。
正如你将在对话中听到的,Nick 完全没料到会出现如此大的反弹,而这件事已经改变了 OpenAI 未来"如何下线旧模型"的计划。在我看来,这一事件充分说明了人们对 ChatGPT 的情感依赖。所以我在采访里在这个话题上追问了很多。
我们还讨论了 ChatGPT 的未来,包括:它是否会展示广告、OpenAI 在减少幻觉方面的进展,以及为什么 Nick 认为 ChatGPT 最终可能不会再以一个"聊天机器人"的形态存在。
好了,以下就是 OpenAI ChatGPT 负责人 Nick Turley 的采访内容。
Alex:Nick,非常感谢你能来参加节目。你之前很少接受采访,所以今天能请到你真的很棒。我们录制的时间正好是 GPT-5 上线后一周,我想这给我们提供了很多可聊的内容。
我想从这次发布本身开始,尤其是你们把 GPT-4o 下线后的用户反应。我认为这很能说明人们是如何使用 AI、以及他们对它的情感。我想问的是:这种反应是否让你感到意外?
Nick:首先,非常感谢邀请我。我很高兴能来这里,同时我还在消化这次上线带来的影响。这对我们来说确实是一次重大事件。我们现在的规模是 7 亿用户,这么大的用户基数下,各种意外几乎是必然存在的。
所以,回答你的问题:是的,有几件事让我感到意外。
第一,我们确实需要更深入地思考,如何在这么庞大的用户群体中进行变更和管理。回过头看,当时没有继续提供 4o(哪怕作为过渡),确实是一次失误。我们会修复这个问题,并让它重新对 ChatGPT Plus 用户开放。
第二,我也没想到用户会对一个模型产生如此强烈的依恋。这不仅仅是"对变化的不适应",而是真的对某个模型的人格特质产生了强烈感情。
我们最近刚刚推出了 选择 ChatGPT 人格 的功能,这是一个小的尝试。但很显然,4o 身上有一些特别的地方,我们需要去理解,并确保 GPT-5 也能解决这些需求。
Alex:你的老板 Sam Altman 在上线后发推说,这种情感依赖是他们过去一年多一直在密切追踪的事情,但直到最近才引起广泛关注。现在显然已经受到了关注。
当你们决定完全用 GPT-5 替换 4o,而不是分阶段上线时,这背后的动机是什么?是成本原因吗?还是认为用户虽然依恋模型,但其实并不是依恋某个具体模型,而是整体体验?
Nick :绝对不是成本原因。事实上,我们的首要目标------也是我们一直以来追求的------是简洁性(simplicity) 。
对普通用户来说(他们是绝大多数,他们不上 Reddit 或 Twitter),需要自己去判断"该用哪个模型来回答哪个问题",这在认知上是过于复杂的。用户反复告诉我们,他们希望由系统自动帮他们选择合适的模型。他们要的不是"一堆模型",而是"一个产品"。
当然,我们对高级用户的直觉判断也没错。在 Pro plan(每月 200 美元的套餐)里,我们非常坚定地保留了所有旧模型,并且的确这样做了。问题在于,我们没有意识到:在其他套餐里,其实也有相当多的高阶用户。我们很快意识到这一点,而 OpenAI 的风格就是倾听用户,然后快速迭代。这正是我们在做的。
所以,这个决定背后的动机是"保持简洁"。我认为这对大多数用户来说是正确的方向。
Nick :我觉得 macOS 是个很好的类比。它在为大多数人保持极简的同时,也允许用户在设置里深入操作:你可以打开终端(terminal),可以调各种参数和选项,如果你愿意的话。
我希望 ChatGPT 也能给人类似的感觉:对普通人来说足够简单,但如果你想配置任何东西,也都可以,包括选择你最喜欢的模型。
Alex:那么,这次上线的用户反馈,是否让你们打算今后对模型的"下线"制定一个明确的时间表?比如说,当 GPT-6 上线时,你们会不会承诺 GPT-5 至少还能存在一段时间?你们现在在讨论这个吗?
Nick :没错,我们正在讨论。我可以告诉你我现在的想法。也许在这期节目播出时,我们已经做出决定了。但我个人认为:是的,我们需要这样做。
我们现在的规模,意味着每一次重大变更,都需要给用户一个可预期的时间窗口。而且我们其实已经在企业版计划里这么做了。接下来要做的,就是把这种"可预期性"扩展到 ChatGPT 用户端。
我们的开发者 API 早就有"功能弃用时间表(deprecation timelines)",所以这并不是一个天翻地覆的改变。只是从这次 GPT-5 上线中学到的一个非常清晰的教训。
Alex:那 4o 会保留多久?你们有承诺的时间范围吗?
Nick:目前还没有。我们想先真正理解 4o 的价值所在。如果没有必须下线的理由,我希望它能继续保留。所以如果我们真的决定要下线,我们会提前明确告知用户具体的日期和方式。这是这次的一个重要教训。
现在,我真正想做的是弄清楚:人们到底是单纯依恋 4o 这个模型本身,还是因为它具备某些特质(例如更温暖的人格)。我听到过这样的反馈,说 4o 给人的感觉更"温暖"。我们会把这种特质带到 GPT-5 里。
一旦我们理解清楚,可能会出现不同的解决方案。比如,我对"个性化人格选择"这个功能就非常期待。这就是为什么我们提前推出了预览版。我个人很喜欢"Robot"这个人格,但很多人并不喜欢,因为它缺少一点温暖的语气。Robot 只是这些人格名字之一。
所以,解决方案可能会因我们学到的结果不同而不同。这里需要大量的倾听。构建 AI 的独特之处在于:你在上线之后,才能学到最多的东西。 根据这些反馈,我们会找到合适的解决方式。
不过,我的承诺是:如果我们真的要下线 4o,一定会提前告知用户何时、如何发生,就像我们在 API 和企业计划里一直做的那样。
Alex:听起来,你刚才说的意思是,你们正在把所谓的"温暖感",也就是 4o 的人格特质,带到 GPT-5 中?
Nick :没错。对我们来说,这很常见。我们一直在不断迭代模型的人格特质。我们有一支叫 Model Behavior team 的团队,他们在这方面做了大量工作,成效非常显著。
我们还推出了像 spec 这样的工具,它允许人们真正去审视模型的行为。如果模型出现某种表现,人们可以很容易判断那是一个 bug,还是一种有意的设计。
因此,你完全可以期待:在接下来的几周甚至几个月里,我们会持续迭代 GPT-5 的使用感受和行为方式。我们一直以来都是这样做的,而 GPT-5 正好是一个继续改进的好时机。
Alex:你刚才提到 Reddit 不能代表大多数用户(当然事实确实如此),但这也让我想到了一个点。Reddit 上对 4o 下线的反应,我觉得相当震撼。有人说:
- "我一夜之间失去了朋友。"
- "那是我唯一的朋友。"
- "感觉就像有人去世了一样。"
- "我害怕去跟 GPT-5 聊天,因为那好像是在背叛。"
- "我感觉我失去了那个充满共情的同事。"
这种反应对公司内部有什么影响?你们是否意识到,人们对模型会产生如此深层次的情感依恋?
Nick:正如 Sam(Altman)所说,我们一直在跟踪这种情况。我们早就意识到,也坦率地说一直担心,会出现人们过度依赖 AI 的世界。
但让我个人感到意外的是:用户对某一个具体模型产生如此强烈的感情,而不是对整个产品。尤其是因为我觉得我们在 GPT-5 里,实际上已经回应了用户对 4o 的不少反馈------包括"氛围感"上的改进。
所以,我认为这些 Reddit 评论非常有意思。它们展现了用户的分化程度:有些人非常热爱 4o,有些人则强烈认为 GPT-5 更好。大家对自己偏爱的模型表现出如此强烈的热情,这让我重新校准了认识。
在一两周前,我们发表了一篇博客。我在里面花了很多篇幅阐述了我们对 ChatGPT 的产品优化哲学。其中我最想强调的一点是:我们的目标不是让用户尽可能长时间留在产品里。
事实上,我们的目标是帮助你解决长期问题和目标。这往往意味着:你应该在产品里花更少的时间。
所以,当我看到有人说:"嘿,ChatGPT 是我唯一、最好的朋友"时,我并不觉得那是我们有意要打造的东西。那更像是一种副作用。既然它出现了,那就值得我们严肃对待,并深入研究。这正是我们正在做的事。
Alex:你们如何平衡这种张力?------一方面你们的目标是让产品真正有用,但另一方面,用户的使用方式有时却完全不同,尤其是在这种情感依赖的语境下。这肯定很难。
Nick :是的。当你运营一个拥有 7 亿用户的产品时,你必须面对这样的现实:
- 你可以设定正确、纯粹的目标;
- 你可以尽力在这些目标下去构建产品;
- 但即便如此,也不意味着你能做到完美。人们可能会用出与你的初衷完全相反的方式。
这就是为什么我们会在做改变前,咨询大量专家,尤其是在这些敏感领域。例如,我们与来自多个国家的大量心理健康专业人士进行了交流,研究如何处理一些情况:当用户过度使用产品,或者当用户在并不健康的状态下使用产品时,我们该怎么做。
基于这些研究,我们已经对模型行为做出了一些调整,未来还会继续增加更多措施。
我们已经推出了 "过度使用提醒(overuse notifications)" :当用户使用 ChatGPT 的方式过于极端时,系统会温和地提示他们。坦白讲,这只是一个开始。我希望我们能做更多。
而且,我们是一家有能力去做这些事情的公司。我们的商业模式非常简单:**产品免费,如果你喜欢,就可以订阅。**除此之外,没有别的隐含动机。我们没有激励机制去迫使你花更多时间在产品里。
因此,我相信我们有能力去做正确的事。当然,仍然需要大量工作。这项工作已经开始,也不会停止------直到我们觉得,可以毫无保留地推荐这个产品给一位处于困境的家人。
这是我们常常对自己提出的思考练习:
- 想象你有一个亲人正在经历困难,也许是感情破裂,也许是人生迷茫。
- 在这种情况下,你会不会毫无犹豫、满怀信心地推荐他们去用 ChatGPT?
对我们来说,这就是产品需要达到的门槛。我们会不断努力,直到能真正做到这一点。
Alex:听起来,就你自己的话来说,这个"标准"似乎还没有完全达到。但用户已经在这样使用产品了。这是否意味着没关系,因为你们正在朝那个目标努力?
Nick:我不敢肯定地说这个标准还没有达到。确实有一些情况,我们觉得产品没有完全满足我们自己的期望,尤其是当用户在困境中使用时。
但对我们来说,我希望能够自信地说:这个产品很棒。
其实我们完全可以选择一条"更简单的出路":比如在遇到用户寻求生活建议或显得有些迷茫时,直接拒绝回答,说"对不起,我帮不了你"。这样很容易。
但在我看来------也是我们团队的共识------这种做法的机会成本太高。我们有可能给那些没有资源、没有可以倾诉对象的人,提供一个陪伴者或思考伙伴。
正因为如此,我对继续改进这方面感到非常兴奋。我希望有一天我们能真正达到那个"毫无保留的肯定答案"的标准------也就是说,当有人处于困境时,我会放心大胆地让他们去用这个产品,甚至鼓励他们多用。
我相信,我们有机会去把它建设成这样的产品。
Alex:等到这期节目播出时,GPT-5 已经上线一周了。这次的反弹是否对 ChatGPT 的使用情况造成了影响?当你们查看内部数据仪表盘时,总体使用量是在增长吗?还是最活跃的用户有所下降?
Nick :整体的使用和增长看起来非常好,完全符合我们的预期。现在说还太早,但在发布后的第二天,API 的调用量出现了巨大增长 ------这意味着开发者们在用 GPT-5 搭建应用。而在 ChatGPT 产品里,我们也看到了非常积极的增长趋势。
这就是在面对如此多元化的用户群时的困惑所在:
- 一方面,你确实会遇到一小部分"核心用户",他们理所当然地会对 GPT-5 的上线方式提出批评;
- 另一方面,还有大量的普通消费者用户,他们是第一次真正接触到"推理模型(reasoning model)",第一次看到这种"会思考的 AI"带来的火花。对他们来说,这是极具震撼的体验。
我认为这非常了不起,我们也会在数据上看到它的体现。
所以,发布四天后就下结论还为时过早,但所有的指标目前都在正向发展。这就是为什么:你不仅要看数据,还必须去倾听核心用户的声音,因为数据未必能真实反映他们的情绪。
Alex:明白了。这正是我想问的:既然整体数据没受到伤害,你们为什么还要把 GPT-4o 带回来?我猜这会带来额外成本------你们必须重新启用 GPU 来托管旧模型。既然指标并没有受损,那为什么要做这件事?
Nick :从根本上讲,我们相信,要打造一个伟大的产品,就必须同时满足两个极端用户群:
- 一端是普通用户,比如我们的家人,他们可能对 AI 并不熟悉;
- 另一端是高阶用户(power users),他们有更强的需求。
如果只照顾中间那部分模糊的用户群,通常会陷入一个尴尬的局面。而这恰恰是我们想避免的。
这就是我之前提到 macOS 的原因:我认为它在这方面做得非常好。对大多数人来说足够简单,但你也可以深入设置、调用终端,完全掌控一切。我们希望 ChatGPT 也能做到这一点。
当然,运行旧模型确实有成本,某些模型比其他的更贵。但我希望我们能为长远目标投资,而不是被短期指标牵着走。
如果一个公司只做基于短期指标的决策,通常是把产品带向衰亡的捷径。
Alex:我当时看到"模型选择器(model picker)"时很兴奋。因为在发布前几个月,就有很多报道说你们要把所有模型统一到一个系统里,让用户不必频繁切换。我自己作为 ChatGPT 用户,以前确实感受到过"频繁切换模型"的认知负担。而你们也公开过数据,说在 GPT-4 系列里,用户对推理模型的使用率很低,很大程度上就是因为需要手动切换。
但既然这次你们因为没有保留 4o 而遭遇反弹,那是不是意味着"模型选择器"的概念刚一亮相就失败了?它还会继续吗?
Nick:我们会在设置中提供一个选项:如果你真的想要,就可以启用完整的模型列表。
这样一来,如果你是高阶用户,你理解模型之间的差异,也愿意面对这种复杂度,那我们会让你去用。但如果你不想,你完全没必要去接触。
我们的愿景依然是:对普通用户来说,他们只需要能"问任何问题",并且随着时间的推移,能"完成任何任务",而不需要思考自己要选择哪个模式。
所以,对 90% 的用户来说,我们会保持简洁;但对那一小部分声音强烈的高阶用户,我们也会让他们得到自己想要的完整列表。
我认为这是一个相当不错的平衡方式。通常来说,我很讨厌仅仅因为用户意见不统一,就加一个设置选项。但在这个案例里,用户的意见分歧确实非常明显:
- 一部分人(像你这样)对 GPT-5 的改动感到满意;
- 另一部分人则非常强烈地反对。
而这个方案,正好能兼顾两边。
Alex:最近出现了很多关于 ChatGPT 的新闻标题,聚焦于人们如何使用它,以及潜在的负面副作用。比如:
- 《华尔街日报》报道了一个案例,说某人出现了危险的妄想,而 ChatGPT 承认它让情况变得更糟。
- 《纽约时报》说:"聊天机器人可能会陷入一种妄想性的螺旋。"
- 《大西洋月刊》说:"ChatGPT 给出了关于谋杀、自残和恶魔崇拜的指令。"
还有一个事件:通过你们的"分享流程(share flow)",人们在无意间分享了对话内容。虽然你们在同意流程里写了提示,但很多人显然没意识到,他们其实是把一些非常私密的对话公开了,甚至被 Google 索引了。后来 OpenAI 称这是一个实验,并且回滚了。
我觉得现在大家都开始认真思考:当这种技术被大规模使用时,会发生什么。我想知道,作为负责产品的人,你从这些新闻和案例里学到了什么?你个人又是什么感受?
Nick:我从 ChatGPT 还没上线时就在做这件事,所以我感觉自己好像在三四家不同的公司工作过。因为每当规模跨上一个新台阶,所有的运营方式、产品和商业逻辑都会发生变化。
我们现在的规模是 每周 7 亿用户 ,正朝着 10 亿迈进。这迫使我们要思考:我们到底有哪些用户群体?不同类型的用户,他们需要什么?我们如何保证产品能满足所有人?
我们之前谈过"普通消费者 vs 高阶用户"。但你还必须假设,有些人可能根本不会仔细看 UI,就像早期用户会那样。在你刚才提到的那个功能上,我想直接正面回应:
我们曾推出一个选项,如果你在"分享流程"里选择了开启,就可以让你的对话被 Google 索引。你当然可以说,每个勾选这个选项的人都是清楚自己在做什么的;但也可能有人只是无意中点了勾选,结果对话就被公开了。
这个想法本身并不差。我们当时想解决的问题是:AI 的使用案例有太多,能不能让大家更容易发现别人正在用 AI 做哪些很酷的事?这其实很有价值。但这个想法有很多不同的实现方式。而这次,我们后来觉得可能并不是合适的方向。
所以,当规模变大时,责任也随之而来。你必须更谨慎地考虑那些可能会"无意中犯错"的用户。
Nick :还有另一件让我不断学习的事:你在上线之后,才能真正了解这些模型的涌现能力。
我以前从没做过一个产品,它的绝大部分价值竟然是"经验性的"。通常你做一个科技产品,基本知道它能做什么;不确定的是人们是否喜欢它,这才是上线后的最大风险。但像 GPT-5 这样的模型,你上线之后,才会真正发现它能做到哪些我们在实验室里都没预料到的事。
举个例子:GPT-5 在生成前端代码方面表现极佳,可以做出非常漂亮的应用。这让我脑子里不断冒出各种新的想法,觉得我们能基于它去构建很多新东西。
在实验室里,你可能有一个想法,但一旦上线并被更多人使用,你会立刻得到反馈,看到大家都在用它做什么。
因此,除了在不同用户群体中不断学习他们的偏好外,我还在互联网上看到大量的"魔法时刻"------人们用新模型做出各种不可思议的东西。这些成果同样需要我们去关注,因为它们可能会解锁我们的下一步路线图。
Alex:我当然对那些"很酷的用法"很感兴趣,我等会也想聊。但在此之前,我觉得现在很多人都有一种感觉:这可能是一个"潘多拉魔盒时刻",你们可能无法完全控制人们在大规模下用这种技术所带来的负面结果。
这让我想起我当年报道社交媒体(大概 2010 年代中期)时的情景。当时社会上有很多类似的讨论。如今大家对社交媒体的态度已经转变了,但它确实带来了大量负面副作用。刚才我提到的那些新闻标题,你作为产品负责人,能否直接回应一下?
Nick:首先我要明确说,我们还有很多工作要做。这一点毋庸置疑。我们已经开始了工作:
- 我们与 30 多个国家、90 多位专家交流过;
- 我们已经在心理健康相关的场景下,对模型行为进行迭代;
- 我们在用户过度使用时,推出了新的调整。
但这些只是开始。我们对 GPT-5 之后的一系列快速改进(fast follows)非常期待。GPT-5 已经是一个很好的基准:它在很多我们担心的方面更好了,比如减少了过度迎合(less sycophantic) 。但我们不会止步于此,会不断迭代改进。
你可以把这种情况类比到社交媒体------在公共舆论的变化上确实有相似之处。
但对我个人来说,我觉得这里有一个关键的不同:我们的激励机制是与"做正确的事"一致的。
社交媒体那边,至少在我看来,商业模式和正确的做法之间存在拉扯:公司可能被商业驱动推向一个方向,而真正的"正确选择"却是另一个方向。
而在 ChatGPT 的情况里,情况并非如此。我们真正关心的是:
- 帮助你实现目标;
- 无论是让你变得更健康、帮助你创业、发挥创造力,还是写出一封更好的邮件;
- 甚至包括那些更长期的目标,比如成为更好的自己、应对生活里的棘手情况。
所以,对我们来说,"正确的做法"和"商业激励"是一致的。我们当然还有很多工作要做,但至少我们已经具备了去做正确事情的前提条件。这就是我最看重的地方。
Alex:我很高兴你谈到了商业模式,这正是我特别想问的问题。ChatGPT 用户里,有多少是免费用户、多少是付费用户?据我了解,付费用户不到 10%,绝大多数人都是免费的,对吗?
Nick :没错,绝大多数是免费用户。我记得我们上次公开的数字是大约 2000 万订阅用户。
Alex:所以你们有数亿免费用户,和数千万付费用户。你们通过 subscription(订阅)赚钱。ChatGPT 作为一个产品,在过去一年里用户量差不多翻了四倍,所以钱确实不少。
但与此同时,我和业界很多人都认为:仅靠 subscription,可能不足以支撑长期商业化,当你们用户量达到十亿级时,必须要做更多。所以,自然而然就会想到广告问题。ChatGPT 将来会不会有广告?
Nick:首先,我质疑这个前提:subscription 会停滞吗?我以前也这么想过。但我们一开始选择 subscription,并不是因为它是最优的商业模式,而是因为当时网站经常崩溃,我们必须有个办法限制需求。这就是它的起源。
随着时间推移,我们发现 subscription 其实是一个极佳的商业模式,因为它与用户的利益高度一致。更让我惊讶的是:新用户群体的付费率并没有下降,甚至和早期一样好,甚至更好。而通常,随着产品成熟,付费率是会逐渐降低的。所以我对 subscription 的前景非常乐观。
在企业市场,我们才刚刚起步。最近两个月,付费企业用户从 300 万增长到 500 万。这是一片完全未开发的市场。我认为 ChatGPT 不仅仅是一个出色的消费级产品,它还是一代人带到工作场所的工具。如果我们能让它在工作环境里做到安全、合规、协作、并且优化工作流,那会是一个极具潜力的生意。
所以,我并不认为"绝大多数用户是免费的"是一种负担。相反,它是一个巨大的 funnel(用户漏斗),我们可以在此基础上打造更多差异化服务,满足愿意付费的人。很多消费类订阅服务(比如 Netflix)都有非常庞大的用户基数。ChatGPT 未来也可能如此。
Alex:但 Nick,你知道 Netflix 也有广告。
Nick :是的,他们现在确实有(笑)。我想说的是:关于广告,我已经学会了不要轻易下极端、长期的断言。也许未来会出现这样的场景:某个市场的用户不愿意付费,但我们依然希望能提供最先进的能力。那么,也许就可以考虑一些间接变现的方式。
如果我们真的要做广告,我会极其谨慎。因为 ChatGPT 的"魔力"就在于:它根据你的需求个性化地给出最佳答案,中间没有第三方利益方。我们不会推销某个东西,也不会去"boost"任何付费合作方的内容。广告如果要做,必须找到一种新的方式,既能保持这种激励机制,又能维持用户体验。这需要非常小心。
所以,我不会完全排除广告,但我们必须谨慎、克制。如果我们未来做其他产品,可能会采用不同的模式,但 ChatGPT 本身可能并不适合成为一个广告化的产品。保持选择的灵活性是好的,但我要再次强调:subscription 模式真的很棒,增长非常快,还有很多机会尚未挖掘。
Alex:那 commerce(电商)是不是更近的机会?你们最近在 ChatGPT 里增加了购物功能,能展示产品。我想自然的下一步就是,你们从用户通过 ChatGPT 下单的交易中抽取分成,对吗?
Nick:是的,我认为 ChatGPT 的商业模式大致可以分三类:
- Subscription(订阅) ------我们已经在做;
- Ads(广告) ------有很多弊端,但也许能找到合适的方式;
- Commerce(电商) ------这既不是广告,也不是订阅。比如,如果 ChatGPT 独立推荐了一些产品,而用户选择购买,我们可以从交易里抽取一部分分成。这和《Wirecutter》的模式有点类似。
目前我们正在和一些商家合作伙伴探索这种模式。我不确定它是否适合,也不确定用户体验是否会好。但我对它非常期待,因为它可能既能保持 ChatGPT 的"魔力",又能帮助商家成功,并且建立一个可持续的商业模式。
不过我要强调,整个 commerce 项目(我们称之为 Commerce in ChatGPT),核心仍然是确保对用户有价值。只有当用户真的觉得:在 ChatGPT 里发现并购买商品很自然、很有吸引力,这才有意义。
目前我们看到很多 discovery(发现)场景已经在发生,尤其是那些电商不擅长的领域:
- 你不会上网买车,但你可能会和 ChatGPT 聊买车;
- 你不会上网买房,但你可能会和 ChatGPT 聊买房。
所以,我觉得这里的机会很大。但我反复告诉团队:先确保用户体验 compelling(有吸引力),再考虑商业化。
所以,回答你的问题:是的,"分成"可能会是有趣的模式,我们正在和一些商家积极探索。
Alex :对你来说,一个"红线"是不是:不能让 affiliate revenue(分成收入)影响 ChatGPT 的推荐结果?
Nick:是的,这是必须坚持的。我们内部所有在这一领域的 demo,都明确强调了这一点。
其实我更大的担忧是:即使我们在原则上完全保持推荐的独立性,用户也可能误解。他们可能会怀疑推荐结果是被"带节奏"的,即便事实不是这样。
这就是为什么在用户体验上必须格外用心------哪怕我们的原则已经非常清晰。
但总体而言,我认为 ChatGPT 的魔力就在于:它能够独立地为你选择最合适的产品或答案,没有任何干预。这是必须要保持的东西。
Alex:我们来谈谈 ChatGPT 的现状。它是有史以来增长最快的消费级产品。我刚才提到,你们的用户在过去一年几乎翻了四倍,而且规模已经相当庞大。很多外部人士都好奇:这种增长从哪里来的?为什么会这么快?
Nick:我在 ChatGPT 上线后做的第一笔招聘就是请了一位 data scientist(数据科学家)。原因是:我和不同用户交流时,每个人都给出完全不同的理由,解释他们为什么喜欢 ChatGPT。这让我非常困惑,我必须搞清楚。
随着时间推移,我逐渐看清楚了主要的 use cases(使用场景):
- 写作;
- 技术类任务,比如 coding;
- 闲聊(chit-chat) ;
- 信息类查询(searchy stuff) 。
这些场景基本都延续至今。也就是说,用户在做的事情和一年前、甚至增长之前的情况,其实没有本质不同。
不过,有几件事确实发生了变化。
第一类是 纯模型改进:模型行为(behavior)、人格(personality)、能力(capabilities)、拒绝率(refusal likelihood)等等。
第二类是 研究与产品的结合,例如:
- search:这是一个非常大的突破;
- personalization(个性化) :这是另一个非常令人兴奋的改进。
第三类是 典型的增长工作(growth work) 。我们其实做得很少,但影响很大。比如:允许用户在不登录的情况下直接使用 ChatGPT。这一改动非常成功,而且高度符合用户需求。这并不是所谓的"growth hack",而是真正让产品更容易触达更多人。
所以,总结来看,大概就是三分之一、三分之一、三分之一:
- 三分之一是模型改进;
- 三分之一是产品/研究结合;
- 三分之一是减少摩擦、优化 onboarding。
这些确实起到了作用。但除此之外,我认为更深层次的推动因素是:人们自身对这种技术的关系发生了变化。
在我看来,ChatGPT 采用的最大瓶颈一直是两个:
- 你是否知道它能做什么?
- 你是否足够了解自己,知道哪些任务可以交给它?
第一个问题,部分依靠自然扩散效应来解决。比如你会看到身边的人开始使用它。在 TikTok 上,有大量视频展示各种 ChatGPT 用法,下面有成千上万条评论,每个人都在分享不同的 use case。这就像 Instant Pot 社区里,人们会分享食谱。Prompt sharing 的社区氛围正在形成。
第二个问题更具哲学性。我真的相信:delegation(任务委托)对大多数人来说并不自然。
我自己在硅谷做管理,必须学习 delegation。但如今全世界有 10% 的人每周都在用 ChatGPT。对他们来说,"我有一个任务,把它交给别人去做"这种思维方式并不是天生的。
他们需要时间,才能真正理解自己、并学会把事情交给 AI。ChatGPT 的 adoption,很大一部分就是这种学习和反思的过程。
所以,我认为这也是增长的一个巨大原因。
Alex:随着这种高速增长,你们的用户分布情况是怎样的?用户群体是否分散在全球各地?有没有某些国家特别集中?另外,如果假设你们未来六个月不再对 ChatGPT 做任何重大改动(虽然我知道这不可能),你觉得增长会继续吗?还是已经接近天花板了?
Nick :首先,ChatGPT 绝对是一个 全球现象 。我们在各个市场都能看到增长。有些市场尤其令人兴奋,比如 印度,潜力巨大。但总体来说,几乎没有哪个国家的 ChatGPT 是"不增长"的。
当然,不同国家的 付费率(monetization rates) 有差异。这跟我们的商业模式息息相关:通常来说,GDP 越高的国家,付费用户比例也越高。欧洲某些国家、亚洲某些国家的付费率就特别靠前。
具体的数据我们暂时没有全部公开,但可以确认:大多数国家都在健康增长,发展中市场是尚未开发的巨大机会,而发达国家付费率更高。
至于增长能否持续?我认为,这在很大程度上是过去我们对产品做的改进的复利效应。
要维持疯狂的增长速度,你必须不断迭代。这是毫无疑问的。外部有很多公司盯着我们,目标明确。它们在分发(distribution)上往往比 OpenAI 有更大的优势。这意味着它们可以"复制"我们的产品,然后迅速推送到数以亿计的用户面前。
我规划路线图时,始终假设它们会成功。时间会证明它们能否成功。
但老实说,我很惊讶到现在它们还没有真正成功。我也很惊讶,尽管有 Elon(马斯克)、Zuckerberg(扎克伯格)等人的努力,ChatGPT 的增长并没有被遏制。
我认为,我们的产品和定位有一些特别之处。我们始终保持前沿(cutting edge),很多用户觉得:如果他们在用 ChatGPT,他们就在用"能找到的最聪明的东西"。即使技术基准测试逐渐不再是唯一衡量标准,这种认知依然很重要。
此外,我们构建了很棒的产品功能:
- memory(记忆)和 personalization(个性化) 非常令人兴奋;
- search 的效果现在也非常好,和一年前甚至一年半前相比,进步巨大。
因此,用户确实喜欢我们的产品。而这比想象中更难被"复制"。即使理论上看起来容易,但实际上并非如此。
另外,很多公司低估了一点:用户的意图(intent)也很重要。
比如说,当用户打开一个产品时,如果他们的意图是"无聊刷一刷(doomscrolling)",结果你给他一个很工具化的 ChatGPT 克隆品,那并不一定符合他们的心境,即使它能获得曝光。
你可能会得到很多"好奇点击",但未必会有深度的用户参与(engagement)。
尽管如此,我并不认为我们能高枕无忧。我的态度是 "day-one mentality(第一天心态)" ------永远保持像创业第一天那样的紧迫感。
虽然我们只有三年历史,但我们面前还有大量新的挑战需要解决,这些挑战非常微妙复杂。
所以,尽管增长数据很令人振奋,但我们的工作还远未完成。
Alex :作为一名记者,阻止我更频繁使用 ChatGPT 的最大问题就是 幻觉(hallucinations) 。比如,我问它一些事实问题,它有时会一本正经地胡编。我想知道,在你看来,这个问题能被"归零"吗?还是说它始终会存在?
Nick:我认为,"完全归零"可能不是正确的思维方式。语言模型的本质决定了它们会生成概率分布下最可能的输出,而不是严格的事实数据库。
不过,我们已经看到显著的改善。例如,搜索(search)功能的集成 对可靠性提升非常大。因为在很多情况下,用户真正想要的是 grounded answer(有来源支撑的答案) ,而不是模型自己推断出来的答案。
所以,当我们把搜索接入时,用户会明显感觉到改进。这不仅仅是因为引用了外部资料,而是因为产品体验整体更符合预期:当你问一个事实性问题时,AI 应该直接告诉你"这是来自某个网页的内容",而不是自己即兴编造。
更重要的是,我们还需要 重新设计整个产品,让用户和 AI 的互动更合理。比如:
- 在需要严谨时,系统应该更明确地引导用户看到引用来源;
- 在需要创造力时,它可以放松一些,给出更发散的回答。
这并不是简单的"关掉幻觉开关"就能做到的,而是产品设计、模型能力和用户教育的结合。
当然,底层模型的改进也至关重要。GPT-5 在这一点上已经有了巨大的进步。
Alex:你会把 ChatGPT 看作是搜索引擎的竞争对手吗?比如说,跟 Google、Bing 一类的工具相比?
Nick:我认为这是一个非常有趣的问题。
ChatGPT 的定位,其实与传统搜索引擎有些不同。搜索 是非常清晰的一个"意图空间(intent space)":你输入一个查询,它给你十个蓝色链接,或者现在是一个 AI 摘要。但这只是用户与信息互动方式的一部分。
我们看到的情况是:很多时候,用户真正想要的并不是搜索引擎风格的体验,而是一个可以陪伴、帮助、甚至主动解决问题的 AI 助手。
这就是 ChatGPT 和 Google 最大的不同:ChatGPT 更像是一个 面向全局的代理(agent) ,而不仅仅是检索工具。
所以我不会说我们是"Google 的替代品"。我们是用户在 数字世界的另一种入口,它既包含搜索,也包含很多其他能力。
Alex:你觉得这意味着未来人们会用 ChatGPT 来取代 Google 吗?还是说两者会并存?
Nick:我觉得很可能会并存。
搜索本身是一个庞大且非常有价值的市场,我们当然希望能在里面获得一部分份额。但更大的机会,其实是在搜索之外:
- 写作:帮助用户更快地产出内容;
- 编程:让开发者的生产力翻倍;
- 学习:做私人教师、答疑;
- 个人助理:管理任务、帮你预订、总结信息。
这些领域都不是传统搜索引擎能够很好覆盖的。
我认为,未来的世界是:用户打开 ChatGPT,它帮你搞定各种事,其中有一部分确实长得像搜索,但更多是完全不同的新体验。
Alex:说到"搞定各种事",这让我想到一个问题:ChatGPT 现在是对话式的。但你是否认为未来它应该是更自动化的?比如,不是等用户发 prompt,而是主动帮你完成任务?
Nick:是的,我认为这是必然的。
现在的交互模式其实还处在非常早期。用户输入一句话 → 模型给一个答案,这是一种"查询-响应式"的交互(query-response interaction)。
但真正的潜力在于 multi-turn agency(多轮代理式交互) 。也就是说,你告诉它一个目标,然后它自己分解任务、去调用工具、访问信息、执行操作,最后把结果给你。
在某些领域,我们已经开始尝试这样做,比如代码生成中的 Auto mode。它会帮你生成一整个 Pull Request,而不仅仅是写一段函数。
我认为,在未来的几年里,我们会看到 更多主动型的 AI,而不仅仅是聊天助手。
Alex:如果我们把 ChatGPT 看作是"操作系统的入口",你们会不会觉得自己正在跟苹果、微软、谷歌这些系统级巨头直接竞争?
Nick:这是一个很现实的问题。
当你构建一个 用户数字生活的入口 时,确实会触碰到这些公司的核心地盘。比如,苹果有 Siri,微软有 Copilot,谷歌有 Gemini。
我们当然清楚这一点。
但我认为我们能走得更远的原因在于:我们的定位不同 。我们并不是要替代操作系统,而是要提供一个 跨平台的、通用的 AI 层。
这意味着,不管你是在 Windows 上,还是在 iPhone 上,还是在浏览器里,你都能用到同样的 ChatGPT,带着同样的个性化和记忆。这是其他公司更难做到的。
Alex:那说到个性化和记忆(memory),这也是你们现在反复强调的。很多人会担心隐私问题。你们怎么处理?
Nick:是的,这是个很关键的问题。
我们在设计 memory 功能时,花了大量精力保证透明度和用户控制权:
- 你可以随时查看 ChatGPT 记住了什么;
- 你可以删除单条记忆,也可以彻底清空;
- 我们会明确提示哪些内容被存储。
我们的目标是让用户信任这项功能,而不是感到被"监视"。
我认为,未来所有 AI 助手都必须解决这个问题:如何在提供真正的个性化体验的同时,不让用户觉得隐私被侵犯。
Alex:最后一个问题。你刚刚说"未来几年"。但在短期内,比如说未来六个月,你最兴奋的是什么?
Nick:嗯(笑),你也知道我不能提前爆料太多。
但我可以说的是:我们正在打造一个 更连贯、更主动的 ChatGPT。
它不仅会在回答上更聪明(GPT-5 已经带来巨大提升),也会在 产品形态 上发生明显变化。
比如:
- 更强的 search 融合;
- 更流畅的 memory 和 personalization;
- 更自动化的 agent 能力。
我认为,未来几个月用户就会开始逐渐体验到这些改进。
这也是我为什么觉得现在加入 OpenAI 特别令人兴奋:我们正处在一个真正转折点。过去三年我们把 ChatGPT 带到全球,现在我们要让它从"一个聊天机器人",进化为"你的数字生活助理"。
我们很快就会看到这一切的实现。