"
"质变点"到来,AI 正式进入"生产级"时代
"
作者 | 简 安
编辑 | 卢旭成
6月23日,火山引擎Force原动力大会在北京举办。会上,火山引擎总裁谭待公布了一组数据:截至今年6月,豆包大模型日均Token调用量已突破180万亿,相比两年前增长超1500倍,过去一年增长超10倍;公有云MaaS服务市场,火山引擎tokens份额提升到49.5%;"万亿Tokens俱乐部"成员从全年12月的100家增至如今的200家,半年翻倍。
值得注意的是,这场发布会并没有将跑分数据作为唯一重点,还拿出了大量真实产业落地案例:芯片设计代码自动生成、工厂培训视频批量制作、车企极端路况仿真训练......几乎都指向同一个方向:AI正在脱离演示场景,进入真实的生产环节。
而几乎差不多时间,全球AI资本市场则呈现出"冰火两重天"的景象:谷歌、微软、亚马逊、Meta等科技巨头股价集体跳水,拖累纳指收跌超1%;国内AI企业智谱则在港股站上万亿级舞台,市值一度达1.27万亿港元,成为国内首家市值破万亿的AI企业。

将产业进展和资本市场的变化放在一起看,一个清晰的判断浮现出来:AI正在跨过从技术验证到生产落地的分水岭,竞争逻辑已经从"比拼谁的模型更强更聪明"转向"谁能真正帮企业干活、用更低的成本干活"。

生产力质变点
发布会上真正让人印象深刻的,是一个芯片设计的真实案例。
在一项RTL(寄存器传输级)代码生成测试中,豆包2.1Pro围绕一个16×16 PE的微型芯片,连续运行近18个小时,经历9轮迭代,最终完成6个核心模块、1300多行RTL代码。更关键的是,它跑通了仿真、测试、综合检查等完整工程流程,且代码最终通过手写数字识别验证。
过去,这类任务需要3-5个资深工程师花费几周才能完成,现在模型只用不到1天就能独立承接核心开发环节。这就是"质变"的展现:它不是某一项能力的小幅提升,而是模型终于可以完整承接一个标准工作环节,真正为企业创造可量化的价值。
另一个展示更具画面感:依托豆包2.1Pro搭建了一个3D虚拟城市,500多个智能Agent协同作业,累计触发上千次工具调用,最终在同一张大地图上建成超过100栋造型、材质、颜色均不同的建筑,并完成多轮自我迭代与全景成片。整个过程中,不同Agent要协调各自任务、处理中途出错、动态调整执行路径------相当于一支小型的数字化施工队。
这些能力背后是模型硬实力在做支撑:豆包2.1Pro在多项国际测评中跻身全球第一梯队,在Terminal Bench 2.1这个业界公认最贴近真实研发的终端编程评测中接近Claude Opus 4.7,在SciCode科学计算代码评测中拿到59.8分,将 Opus 4.7和GPT-5.5都甩在身后。谭待认为:豆包大模型 2.1 Pro 已经达到可用标准,进入 Agent可用门槛,"标志着我们在Coding 领域真正上牌桌了"。而在国内,真正能站上这张牌桌的玩家还没几个。

Agent方向的产业落地也在同步加速:顺丰科技基于AgentKit构建企业级统一智能体平台,覆盖研发提效、物流调度等场景;新东方用豆包大模型打造"AI助教"Agent,实现口语练习、作文批改的个性化教学闭环;涂鸦智能将豆包模型接入AIoT生态,每天完成超过1.55亿次AI交互......这些案例的共同特点是:AI不再只是辅助工具,而是进入了企业的核心业务流程。
这也印证了谭待在大会期间反复强调的"生产力质变点"的概念。在他看来,只有模型能力跨越"质变点",才能真正满足企业与个人在生产场景中的使用需求。而所谓"质变点",本质上是模型能力真正进入生产流程,能稳定承接完整的工作环节,创造实际价值,而不是停留在Demo演示阶段。
那么,如何判断一个模型跨过了"质变点"?谭待举了一个很有意思的例子:Seedance 2.0发布前,视频生成工具的周末调用量远高于工作日,大家都把它当作娱乐玩具;但Seedance 2.0上线后,工作日负载和使用次数反而远超周末。调用时间的分布变化,成了最直观的证据:说明视频生成已经进入办公和生产环节,人们在工作日用它干活,而不是周末拿来消遣。
按这个标准,Seedance 2.0也成为第一个跨过生产质变点的视频生成模型。现在,Seedance 2.0已经实现原生4K生成能力,支持4K 10-bit高位深原生直出。与后期超分不同,原生4K从生成阶段就保留了高密度的画面信息,发丝、面料肌理、建筑线条等细节都能完整呈现。

它的应用场景也早已跳脱内容创作领域,向着实体产业渗透:制造业用它制作多语言产品说明书、售后服务和培训视频;自动驾驶企业用它合成极端天气、罕见事故等训练数据;具身智能企业用它生成高质量合成数据,训练机器人感知和操作能力......越来越多行业和企业开始把AI放进真实业务流程,Seedance已经具备实体产业价值。
将于7月初正式上线的全新Seedance 2.5还将在三个维度实现突破:单段生成长度30秒,全球最长;最多支持50个全模态素材联合输入,全球最多,相比业界水平提升近7倍;支持在维持整体画面不变的前提下,对局部内容单独修改。这些升级将进一步推动视频模型向实体产业场景渗透。

谭待在采访中明确表示:"短剧对Seedance来说,只是一个极小的落地场景,面向世界模型的基础可能是未来Seedance更大的想象空间所在。"这并非营销话术:当一个模型能够生成符合物理规律、保持时间空间一致性的连续画面时,本身就意味着它对物理世界有了相当程度的内在理解。而这种理解能力,是它走出内容创作、进入实体产业的核心基础。

生态化闭环
一个常被忽视的问题是:同样是视频生成大模型,为什么率先跑通规模化商用的是Seedance。答案不只是模型技术本身,还在于字节独特的生态结构。
在本次火山引擎FORCE原动力大会上,字节CEO梁汝波通过视频首次对外公开阐述了公司的AI战略。他将AI定义为"至少不亚于PC、Web和Mobile"的变革,并将"勇攀高峰"定为公司年度关键词,核心就是攀登AI时代最高峰、做好大模型技术能力。过去几年,字节收缩业务宽度,把精力重点聚焦到AI领域,在AI内部进一步聚焦于模型能力的提升。在这一战略下,火山引擎MaaS业务正在变成字节的基础业务,公司将对此长期、坚定地投入。
字节的AI投入规模同样惊人。据行业公开信息,2025年字节全年资本开支约1600亿元,其中约900亿元用于AI算力芯片与服务器采购,占比超过一半。2026年,AI基础设施预算上调至约2000亿元,其中约850亿元专项用于AI芯片采购。去年字节整体营收规模超万亿,有充足的资本投入AI研发和算力建设。
这其中,火山引擎则扮演云基础设施的角色,将字节内部验证过的模型能力、工程优化能力等打包成标准化的云服务开放给行业。比如 Seedance 经过推理优化,可以适配多种算力芯片,大幅降低企业使用成本;豆包模型先在字节内部的飞书、研发场景大规模使用,,经过真实业务打磨成熟后再对外开放。

"性价比"重构
现阶段,"谁能真正帮企业干活"很重要,而"谁能用更低成本干活"也变得更加重要。而相比之下,国内同级别模型的定价普遍比海外模型便宜很多。
从豆包2.1Pro的定价看:每百万Token输入6元、输出30元,缓存命中条件下仅1.2元,综合使用成本相较Claude Opus 4.6至4.8降低近80%。而面向更高频调用场景和规模化部署的豆包2.1 Turbo,价格还能再减半。火山引擎的思路很明确:用更强的模型和更低的成本,推动 Agent在企业场景中大规模落地。
把视野再放大,国内模型的价格优势已经非常显著。有网友对当前中美模型Token成本做了对比:Anthropic最新一代舰模型 Claude Opus 4.8的价格为每百万token输入5美元、输出25美元;而DeepSeek V4-Pro在永久降价后,每百万token输入仅0.435美元、输出0.87美元。

值得注意的是,在SWE-Bench Verified 这个权威编程基准上,DeepSeek V4-Pro 拿到80.6 分,仅落后 Claude Opus 4.8(80.8 分)0.2 分------能力已经追到0.2分的差距,价格却相差了近29倍。
Anthropic自己也在变相降价:曾经一路涨价的Opus,Fast Mode价格从每百万token输入30美元、输出150美元下调至输入10美元、输出50美元,高端模型的定价权开始松动。更值得关注的是,海外企业的AI预算正在从 "token max"转向"token 节流"。据了解,Uber被曝只用3个月就把全年AI预算烧光后,硅谷大厂们纷纷开始对自家员工的token使用设置限额。整个产业都在传递同一个信号:高价token的增长模式已经难以为继,AI经济正在向"成本敏感"的方向重塑。
这也是谷歌、微软等股价波动的深层原因之一。表面上看,股价下跌和核心研发人员流动等事件相关,但更底层的逻辑是:大模型行业正在从"谁模型最强"进入"谁每百万token更划算"的价值比拼阶段。而这对于谷歌、微软、亚马逊等而言,无疑都是利空消息。

过去,资本市场给他们的AI云业务估值的逻辑是:企业用AI越多,token消耗越多,云厂商和模型厂商的收入就越高,整个链条都能持续扩张。但当企业客户开始对token成本敏感,模型厂商就必须降价,云厂商也要随之让利。而一旦价格战开启,市场就会怀疑:大模型到底是不是一个高定价权的生意?
当然,海外模型在前沿能力上仍具备显著优势,但中国模型的追赶速度已经远超市场预期。而当能力差距逐渐缩小,价格优势就会被成倍放大。这也是市场重新评估海外AI厂商估值的重要原因。
需要明确的是,国内模型的价格优势并不是靠亏本补贴换来的,背后有实实在在的产业支撑:中国有充足的电力供应,绿电建设全球领先,算力集群的运营成本更低;国内完整的算力产业链,也让硬件部署和维护成本更有优势。
火山引擎的定价思路也印证了这一点。谭待在采访中也强调"价值比价格重要":看模型不能只看价格,而是要看它能创造多少价值。"客户都很聪明,知道模型创造的价值跟过去比是值这个定价的,本质还是模型价值提升了。"
更值得关注的是,定价背后的战略判断:三年前,火山引擎就把MaaS列为核心业务,"当时还有人讨论Token是不是不健康,今天听来有点可笑。但在那个时候,几乎所有人都觉得Token是赔钱的生意。"而现在,豆包大模型日均调用量突破180万亿,恰恰印证了当初的判断。三年时间,Token调用量增长 1500倍,市场份额接近50%。在谭待看来:对未来的预见性和战略的确定性,也是火山引擎保持竞争力非常重要的一点。

小结
回到最初的问题:AI+应用,到底进化到什么程度了?
我们可以用谭待对大模型的一个比喻来类比:两年前,大模型还处在"大哥大"时代,只有少数人能接触和使用;现在则已经进化到了功能机阶段------大模型不再是少数人尝鲜的玩具,而是真实进入到更多人的生活和工作中。
"一个很重要的变化是,模型进入到了创作、Coding、Agent 的商业生产级领域。一旦进去之后,它就可以走出商业闭环,可以赚到钱,有钱就可以做更好的模型,创造更大的价值,这个飞轮就转起来了。"谭待说。
目前,在Coding和视频生成两个领域,质变已经发生,商业闭环正在跑通。而在更广泛的企业级Agent应用中,这个过程才刚开始:HiAgent 3.0推出"数字员工生命周期管理",AgentKit新增Policy和Registry模块,ArkClaw企业版落地......这些产品迭代的背后,是把Agent从"技术演示"变成"可管理的企业资产"的尝试。
AI应用真正的下一步,不是模型再聪明多少,而是能否稳定、安全、低成本地嵌入企业核心业务,并产生可量化的回报。正如谭待所说,整个市场还非常早期,"市场本身还有十倍百倍的增长空间"。
