黄仁勋要发Token当工资!硅谷兴起刷量大赛,一人一周烧掉33个维基百科

OpenAI 最烧 Token 的人有多狠?

一位匿名员工,上周处理了 2100 亿 Tokens,是全公司之最,足够把整个维基百科填满 33 遍。

他不是在做什么惊天大项目,就只是公司内部排行榜第一名而已。

与此同时,在隔壁 Anthropic 一位 Claude Code 用户单月账单超过 15 万美元,折合人民币过百万元。

这便是硅谷新风尚 Tokenmaxxing,直译过来就是 "Token 刷量大赛"。

具体来说:

  • AI 公司内部开始出现排行榜,追踪每个员工的 token 消耗量;

  • 招聘时," 你能给我多少 token 预算 "正在成为工程师最关心的问题之一;

  • Meta 和 Shopify 甚至把 AI 使用量写进了绩效考核标准。

Token 这个 AI 处理的最小文本单位,正在从技术术语变成硅谷的新型货币。

从月付 200 到年烧 10 万

风投机构 Theory Ventures 创始人 Tomasz Tunguz 亲身经历了 Token 账单的指数级膨胀。

六个月前,他每月在 Claude 上花 200 美元。然后加了三个 agent 订阅 Codex、Gemini 和 Claude Code,月费涨到 600 美元。

接着他开始用 AI 把待办清单自动变成完成清单,每天处理 31 项任务,日均推理账单飙到 92 美元。再加上每月 400 美元的智能体浏览器。

半年之内,他的 AI 推理支出从年化 7200 美元涨到 4.3 万美元,再到超过 10 万美元。

但在一年前,一个人想用掉这么多 token 几乎不可能。

假设一个学生写篇论文,来回修改几轮,大概消耗 1 万个 token,约等于 7500 个英文单词。

要烧掉几十亿个 Token,得在电脑前不停下指令好几十小时。

Coding Agent 改变了一切。

Claude Code、Codex 这类工具可以在无人监督的状态下连续工作数小时,审查和编辑大型代码库,从一条指令生成完整程序。每个 agent 还能派生出子 agent 处理不同子任务,每一步都在生成成千上万个 Token。

龙虾 OpenClaw 更是 24/7 不停工作。

Token 消耗的爆炸直接推高了 AI 公司的收入。

Anthropic 今年在两个月内将收入预期翻了一倍多,Claude Code 年化收入达到 25 亿美元。

OpenAI 的 Codex 周活跃用户超过 200 万,年初以来增长两倍,Token 使用量增长五倍。

Google 去年透露,其 AI 模型每月处理超过 1.3 万万亿(quadrillion)个 Token。

不过,这场增长背后有个关键推手:补贴。

OpenAI 和 Anthropic 都在 200 美元 / 月的订阅计划里提供了价值约 1000 美元的 Token 额度。

和当年打车、外卖用发优惠券抢市场的逻辑一模一样。

Token 成为第四种薪酬

英伟达 GTC 2026 上,黄仁勋把这股暗流推到了台面上,抛出了一个让所有人竖起耳朵的提议:

工程师年薪几十万美元,我会在基础薪资之上再给他们相当于一半年薪的 token,让他们能力放大 10 倍。当然我愿意这么做。

黄仁勋成了第一个公开谈论 "公司 Token 预算" 的重量级 CEO。

在他的框架里,Token 正在变成继工资、奖金、期权之后的第四种薪酬。

根据薪酬追踪网站 Levels.fyi 的数据,硅谷 75 分位软件工程师的年薪是 37.5 万美元(约 262 万人民币)。如果再加 10 万美元的 token 预算,总包就是 47.5 万美元,其中 21% 是 token。

OpenAI Codex 工程负责人 Thibault Sottiaux 最近在 X 上写道,AI 算力正变得越来越稀缺、越来越值钱:

候选人面试时越来越多问我:我能有多少专属推理算力。

内卷还是生产力?

在 OpenAI 内部,员工已经可以在排行榜上看到同事消耗了多少 token。

公司 token 预算正在成为一种员工福利,就像医疗保险或免费午餐。

另一面,Shopify 和 Meta 已经把 AI 使用纳入了绩效考核,奖励重度使用的员工,批评不用的。

风险投资人 Nikunj Kothari 这样描述弥漫硅谷的新情绪 Token 焦虑。

晚饭时的开场白过去是 "你在做什么?" 现在变成了 "你跑了几个 agent?"

但质疑声音也在出现。一位匿名 OpenAI 员工评价同事们的 token 竞赛:这看起来不可持续。

排行榜不衡量产出质量。那些刷到数十亿 token 的人,到底在产出有用的东西,还是只是在空转、看起来很忙?

当一家公司为每个员工支付的 Token 费用接近甚至超过这个人的工资时,财务部门对 "人头" 的算法就会发生变化:

如果算力在干活,到底需要多少人来协调它?

参考链接:

1\][tomtunguz.com/inference-a...](https://link.juejin.cn?target=https%3A%2F%2Ftomtunguz.com%2Finference-as-compensation%2F "https://tomtunguz.com/inference-as-compensation/") \[2\][www.nytimes.com/2026/03/20/...](https://link.juejin.cn?target=https%3A%2F%2Fwww.nytimes.com%2F2026%2F03%2F20%2Ftechnology%2Ftokenmaxxing-ai-agents.html "https://www.nytimes.com/2026/03/20/technology/tokenmaxxing-ai-agents.html") \[3\][www.wsj.com/tech/ai/cla...](https://link.juejin.cn?target=https%3A%2F%2Fwww.wsj.com%2Ftech%2Fai%2Fclaude-code-cursor-codex-vibe-coding-52750531 "https://www.wsj.com/tech/ai/claude-code-cursor-codex-vibe-coding-52750531") **欢迎在评论区留下你的想法!** --- **完** ---

相关推荐
视觉&物联智能1 小时前
【杂谈】-洞察业务风险潜藏暗礁:影子人工智能如何重塑移动威胁格局
人工智能·网络安全·aigc·agi
洛卡卡了1 小时前
Hermes Agent 火了,我也把它从安装到飞书聊天跑了一遍
人工智能·aigc·ai编程
春末的南方城市2 小时前
CVPR 2026 | 复旦开源首个端到端多模态矢量动画生成框架OmniLottie:UI动效革命,文本/图像一键转Lottie动画!
人工智能·深度学习·机器学习·计算机视觉·aigc
怕浪猫3 小时前
第12章 工具(Tools)与函数调用(LangChain实战)
langchain·aigc·ai编程
小程故事多_803 小时前
从Claude Code源码泄露,读懂12个可复用的Agentic Harness设计模式(生产级落地指南)
人工智能·设计模式·aigc·ai编程·harness
阿杰学AI3 小时前
AI核心知识116—大语言模型之 目标驱动的可控架构 (简洁且通俗易懂版)
人工智能·ai·语言模型·自然语言处理·aigc·机械学习·目标驱动的可控架构
墨风如雪12 小时前
越用越强不是广告语:拆解 Hermes Agent 的三层学习机制
aigc
小程故事多_8016 小时前
从零吃透Transformer核心,多头注意力、残差连接与前馈网络(大白话完整版)
人工智能·深度学习·架构·aigc·transformer
与虾牵手18 小时前
OpenClaw Nanobot 架构拆解:从源码学会 AI Agent 的骨架设计(2026)
aigc·ai编程
s1mple“”20 小时前
互联网大厂Java面试实录:谢飞机的AIGC求职之旅 - JVM并发编程到Spring Cloud微服务
spring boot·aigc·微服务架构·java面试·分布式系统·rag技术·redis数据库