刚刚,谷歌深夜上新 Veo 3.1!网友狂刷 2.75 亿条,Sora 2 要小心了

「【新智元导读】谷歌凌晨更新 Veo 3.1,主打更强叙事与音频控制、首尾帧与多图参考等精控,接入 Gemini API 与 Vertex AI,Flow 与 Gemini 可用。可合成多人物场景、音画同步,片段最长约 148 秒;规格至 1080p/24fps。」

刚刚,谷歌在今天凌晨更新了旗舰视频生成模型 Veo 3.1。

Veo 3.1 技术规格上支持输出 720p 或 1080p 分辨率的视频,帧率为 24 帧 / 秒(fps)。

视频时长可选 4 秒、6 秒或 8 秒,若使用 Extend 功能,视频最长可扩展至 148 秒。

各位觉得 Veo 3.1 的效果能不能打过 Sora 2 呢?

这次的 Veo 3.1 更像「功能小升级」------新增首尾帧、多图参考等控制。

但成片质感较 Veo 3 进步有限,甚至略微显得有点「假」。

原生时长仍只有 8 秒,Flow 延长至 30 秒画面偶有衔接,音频提升其实很一般。

基础物理表现比过去好些,但一遇到人物表演与复杂调度还是会露馅。

但这个只是 Veo 3->Veo 3.1 的一次微调。

期待一下谷歌年底的大招,估计会配合 Gemini 3 全家桶发布。

参考资料:

x.com/GoogleDeepM...

相关推荐
罗西的思考39 分钟前
AI Agent框架探秘:拆解 OpenHands(10)--- Runtime
人工智能·算法·机器学习
冬奇Lab1 小时前
OpenClaw 源码精读(2):Channel & Routing——一条消息如何找到它的 Agent?
人工智能·开源·源码阅读
冬奇Lab1 小时前
一天一个开源项目(第38篇):Claude Code Telegram - 用 Telegram 远程用 Claude Code,随时随地聊项目
人工智能·开源·资讯
李剑一2 小时前
你以为OpenClaw在帮你赚钱?其实它是在赚你的钱
openai·agent
狗胜3 小时前
二等兵甘观察日记 #009:当 Agent 开始怀疑自己的记忆
openai
狗胜3 小时前
AI观察日记 2026-03-02|技术趋势:Moltbook 社区的技术洞察
openai
格砸3 小时前
从入门到辞职|从ChatGPT到OpenClaw,跟上智能时代的进化
前端·人工智能·后端
可观测性用观测云3 小时前
可观测性 4.0:教系统如何思考
人工智能
sunny8653 小时前
Claude Code 跨会话上下文恢复:从 8 次纠正到 0 次的工程实践
人工智能·开源·github