火山引擎谭待：Seedance更大想象空间在世界模型

"质变点"到来，AI 正式进入"生产级"时代

作者 | 简安

编辑 | 卢旭成

6月23日，火山引擎Force原动力大会在北京举办。会上，火山引擎总裁谭待公布了一组数据：截至今年6月，豆包大模型日均Token调用量已突破180万亿，相比两年前增长超1500倍，过去一年增长超10倍；公有云MaaS服务市场，火山引擎tokens份额提升到49.5%；"万亿Tokens俱乐部"成员从全年12月的100家增至如今的200家，半年翻倍。

值得注意的是，这场发布会并没有将跑分数据作为唯一重点，还拿出了大量真实产业落地案例：芯片设计代码自动生成、工厂培训视频批量制作、车企极端路况仿真训练......几乎都指向同一个方向：AI正在脱离演示场景，进入真实的生产环节。

而几乎差不多时间，全球AI资本市场则呈现出"冰火两重天"的景象：谷歌、微软、亚马逊、Meta等科技巨头股价集体跳水，拖累纳指收跌超1%；国内AI企业智谱则在港股站上万亿级舞台，市值一度达1.27万亿港元，成为国内首家市值破万亿的AI企业。

将产业进展和资本市场的变化放在一起看，一个清晰的判断浮现出来：AI正在跨过从技术验证到生产落地的分水岭，竞争逻辑已经从"比拼谁的模型更强更聪明"转向"谁能真正帮企业干活、用更低的成本干活"。

生产力质变点

发布会上真正让人印象深刻的，是一个芯片设计的真实案例。

在一项RTL（寄存器传输级）代码生成测试中，豆包2.1Pro围绕一个16×16 PE的微型芯片，连续运行近18个小时，经历9轮迭代，最终完成6个核心模块、1300多行RTL代码。更关键的是，它跑通了仿真、测试、综合检查等完整工程流程，且代码最终通过手写数字识别验证。

过去，这类任务需要3-5个资深工程师花费几周才能完成，现在模型只用不到1天就能独立承接核心开发环节。这就是"质变"的展现：它不是某一项能力的小幅提升，而是模型终于可以完整承接一个标准工作环节，真正为企业创造可量化的价值。

另一个展示更具画面感：依托豆包2.1Pro搭建了一个3D虚拟城市，500多个智能Agent协同作业，累计触发上千次工具调用，最终在同一张大地图上建成超过100栋造型、材质、颜色均不同的建筑，并完成多轮自我迭代与全景成片。整个过程中，不同Agent要协调各自任务、处理中途出错、动态调整执行路径------相当于一支小型的数字化施工队。

这些能力背后是模型硬实力在做支撑：豆包2.1Pro在多项国际测评中跻身全球第一梯队，在Terminal Bench 2.1这个业界公认最贴近真实研发的终端编程评测中接近Claude Opus 4.7，在SciCode科学计算代码评测中拿到59.8分，将 Opus 4.7和GPT-5.5都甩在身后。谭待认为：豆包大模型 2.1 Pro 已经达到可用标准，进入 Agent可用门槛，"标志着我们在Coding 领域真正上牌桌了"。而在国内，真正能站上这张牌桌的玩家还没几个。

Agent方向的产业落地也在同步加速：顺丰科技基于AgentKit构建企业级统一智能体平台，覆盖研发提效、物流调度等场景；新东方用豆包大模型打造"AI助教"Agent，实现口语练习、作文批改的个性化教学闭环；涂鸦智能将豆包模型接入AIoT生态，每天完成超过1.55亿次AI交互......这些案例的共同特点是：AI不再只是辅助工具，而是进入了企业的核心业务流程。

这也印证了谭待在大会期间反复强调的"生产力质变点"的概念。在他看来，只有模型能力跨越"质变点"，才能真正满足企业与个人在生产场景中的使用需求。而所谓"质变点"，本质上是模型能力真正进入生产流程，能稳定承接完整的工作环节，创造实际价值，而不是停留在Demo演示阶段。

那么，如何判断一个模型跨过了"质变点"？谭待举了一个很有意思的例子：Seedance 2.0发布前，视频生成工具的周末调用量远高于工作日，大家都把它当作娱乐玩具；但Seedance 2.0上线后，工作日负载和使用次数反而远超周末。调用时间的分布变化，成了最直观的证据：说明视频生成已经进入办公和生产环节，人们在工作日用它干活，而不是周末拿来消遣。

按这个标准，Seedance 2.0也成为第一个跨过生产质变点的视频生成模型。现在，Seedance 2.0已经实现原生4K生成能力，支持4K 10-bit高位深原生直出。与后期超分不同，原生4K从生成阶段就保留了高密度的画面信息，发丝、面料肌理、建筑线条等细节都能完整呈现。

它的应用场景也早已跳脱内容创作领域，向着实体产业渗透：制造业用它制作多语言产品说明书、售后服务和培训视频；自动驾驶企业用它合成极端天气、罕见事故等训练数据；具身智能企业用它生成高质量合成数据，训练机器人感知和操作能力......越来越多行业和企业开始把AI放进真实业务流程，Seedance已经具备实体产业价值。

将于7月初正式上线的全新Seedance 2.5还将在三个维度实现突破：单段生成长度30秒，全球最长；最多支持50个全模态素材联合输入，全球最多，相比业界水平提升近7倍；支持在维持整体画面不变的前提下，对局部内容单独修改。这些升级将进一步推动视频模型向实体产业场景渗透。

谭待在采访中明确表示："短剧对Seedance来说，只是一个极小的落地场景，面向世界模型的基础可能是未来Seedance更大的想象空间所在。"这并非营销话术：当一个模型能够生成符合物理规律、保持时间空间一致性的连续画面时，本身就意味着它对物理世界有了相当程度的内在理解。而这种理解能力，是它走出内容创作、进入实体产业的核心基础。

生态化闭环

一个常被忽视的问题是：同样是视频生成大模型，为什么率先跑通规模化商用的是Seedance。答案不只是模型技术本身，还在于字节独特的生态结构。

在本次火山引擎FORCE原动力大会上，字节CEO梁汝波通过视频首次对外公开阐述了公司的AI战略。他将AI定义为"至少不亚于PC、Web和Mobile"的变革，并将"勇攀高峰"定为公司年度关键词，核心就是攀登AI时代最高峰、做好大模型技术能力。过去几年，字节收缩业务宽度，把精力重点聚焦到AI领域，在AI内部进一步聚焦于模型能力的提升。在这一战略下，火山引擎MaaS业务正在变成字节的基础业务，公司将对此长期、坚定地投入。

字节的AI投入规模同样惊人。据行业公开信息，2025年字节全年资本开支约1600亿元，其中约900亿元用于AI算力芯片与服务器采购，占比超过一半。2026年，AI基础设施预算上调至约2000亿元，其中约850亿元专项用于AI芯片采购。去年字节整体营收规模超万亿，有充足的资本投入AI研发和算力建设。

这其中，火山引擎则扮演云基础设施的角色，将字节内部验证过的模型能力、工程优化能力等打包成标准化的云服务开放给行业。比如 Seedance 经过推理优化，可以适配多种算力芯片，大幅降低企业使用成本；豆包模型先在字节内部的飞书、研发场景大规模使用，，经过真实业务打磨成熟后再对外开放。

"性价比"重构

现阶段，"谁能真正帮企业干活"很重要，而"谁能用更低成本干活"也变得更加重要。而相比之下，国内同级别模型的定价普遍比海外模型便宜很多。

从豆包2.1Pro的定价看：每百万Token输入6元、输出30元，缓存命中条件下仅1.2元，综合使用成本相较Claude Opus 4.6至4.8降低近80%。而面向更高频调用场景和规模化部署的豆包2.1 Turbo，价格还能再减半。火山引擎的思路很明确：用更强的模型和更低的成本，推动 Agent在企业场景中大规模落地。

把视野再放大，国内模型的价格优势已经非常显著。有网友对当前中美模型Token成本做了对比：Anthropic最新一代舰模型 Claude Opus 4.8的价格为每百万token输入5美元、输出25美元；而DeepSeek V4-Pro在永久降价后，每百万token输入仅0.435美元、输出0.87美元。

值得注意的是，在SWE-Bench Verified 这个权威编程基准上，DeepSeek V4-Pro 拿到80.6 分，仅落后 Claude Opus 4.8（80.8 分）0.2 分------能力已经追到0.2分的差距，价格却相差了近29倍。

Anthropic自己也在变相降价：曾经一路涨价的Opus，Fast Mode价格从每百万token输入30美元、输出150美元下调至输入10美元、输出50美元，高端模型的定价权开始松动。更值得关注的是，海外企业的AI预算正在从 "token max"转向"token 节流"。据了解，Uber被曝只用3个月就把全年AI预算烧光后，硅谷大厂们纷纷开始对自家员工的token使用设置限额。整个产业都在传递同一个信号：高价token的增长模式已经难以为继，AI经济正在向"成本敏感"的方向重塑。

这也是谷歌、微软等股价波动的深层原因之一。表面上看，股价下跌和核心研发人员流动等事件相关，但更底层的逻辑是：大模型行业正在从"谁模型最强"进入"谁每百万token更划算"的价值比拼阶段。而这对于谷歌、微软、亚马逊等而言，无疑都是利空消息。

过去，资本市场给他们的AI云业务估值的逻辑是：企业用AI越多，token消耗越多，云厂商和模型厂商的收入就越高，整个链条都能持续扩张。但当企业客户开始对token成本敏感，模型厂商就必须降价，云厂商也要随之让利。而一旦价格战开启，市场就会怀疑：大模型到底是不是一个高定价权的生意？

当然，海外模型在前沿能力上仍具备显著优势，但中国模型的追赶速度已经远超市场预期。而当能力差距逐渐缩小，价格优势就会被成倍放大。这也是市场重新评估海外AI厂商估值的重要原因。

需要明确的是，国内模型的价格优势并不是靠亏本补贴换来的，背后有实实在在的产业支撑：中国有充足的电力供应，绿电建设全球领先，算力集群的运营成本更低；国内完整的算力产业链，也让硬件部署和维护成本更有优势。

火山引擎的定价思路也印证了这一点。谭待在采访中也强调"价值比价格重要"：看模型不能只看价格，而是要看它能创造多少价值。"客户都很聪明，知道模型创造的价值跟过去比是值这个定价的，本质还是模型价值提升了。"

更值得关注的是，定价背后的战略判断：三年前，火山引擎就把MaaS列为核心业务，"当时还有人讨论Token是不是不健康，今天听来有点可笑。但在那个时候，几乎所有人都觉得Token是赔钱的生意。"而现在，豆包大模型日均调用量突破180万亿，恰恰印证了当初的判断。三年时间，Token调用量增长 1500倍，市场份额接近50%。在谭待看来：对未来的预见性和战略的确定性，也是火山引擎保持竞争力非常重要的一点。

小结

回到最初的问题：AI+应用，到底进化到什么程度了？

我们可以用谭待对大模型的一个比喻来类比：两年前，大模型还处在"大哥大"时代，只有少数人能接触和使用；现在则已经进化到了功能机阶段------大模型不再是少数人尝鲜的玩具，而是真实进入到更多人的生活和工作中。

"一个很重要的变化是，模型进入到了创作、Coding、Agent 的商业生产级领域。一旦进去之后，它就可以走出商业闭环，可以赚到钱，有钱就可以做更好的模型，创造更大的价值，这个飞轮就转起来了。"谭待说。

目前，在Coding和视频生成两个领域，质变已经发生，商业闭环正在跑通。而在更广泛的企业级Agent应用中，这个过程才刚开始：HiAgent 3.0推出"数字员工生命周期管理"，AgentKit新增Policy和Registry模块，ArkClaw企业版落地......这些产品迭代的背后，是把Agent从"技术演示"变成"可管理的企业资产"的尝试。

AI应用真正的下一步，不是模型再聪明多少，而是能否稳定、安全、低成本地嵌入企业核心业务，并产生可量化的回报。正如谭待所说，整个市场还非常早期，"市场本身还有十倍百倍的增长空间"。