刚刚,谷歌深夜上新 Veo 3.1!网友狂刷 2.75 亿条,Sora 2 要小心了

「【新智元导读】谷歌凌晨更新 Veo 3.1,主打更强叙事与音频控制、首尾帧与多图参考等精控,接入 Gemini API 与 Vertex AI,Flow 与 Gemini 可用。可合成多人物场景、音画同步,片段最长约 148 秒;规格至 1080p/24fps。」

刚刚,谷歌在今天凌晨更新了旗舰视频生成模型 Veo 3.1。

Veo 3.1 技术规格上支持输出 720p 或 1080p 分辨率的视频,帧率为 24 帧 / 秒(fps)。

视频时长可选 4 秒、6 秒或 8 秒,若使用 Extend 功能,视频最长可扩展至 148 秒。

各位觉得 Veo 3.1 的效果能不能打过 Sora 2 呢?

这次的 Veo 3.1 更像「功能小升级」------新增首尾帧、多图参考等控制。

但成片质感较 Veo 3 进步有限,甚至略微显得有点「假」。

原生时长仍只有 8 秒,Flow 延长至 30 秒画面偶有衔接,音频提升其实很一般。

基础物理表现比过去好些,但一遇到人物表演与复杂调度还是会露馅。

但这个只是 Veo 3->Veo 3.1 的一次微调。

期待一下谷歌年底的大招,估计会配合 Gemini 3 全家桶发布。

参考资料:

x.com/GoogleDeepM...

相关推荐
海边夕阳200610 小时前
【每天一个AI小知识】:什么是循环神经网络?
人工智能·经验分享·rnn·深度学习·神经网络·机器学习
2501_9181269110 小时前
如何用ai做开发
人工智能
f***a34610 小时前
开源模型应用落地-工具使用篇-Spring AI-高阶用法(九)
人工智能·spring·开源
用户51914958484510 小时前
BBDown:高效便捷的哔哩哔哩视频下载工具
人工智能·aigc
CV实验室10 小时前
CV论文速递:覆盖视频生成与理解、3D视觉与运动迁移、多模态与跨模态智能、专用场景视觉技术等方向 (11.17-11.21)
人工智能·计算机视觉·3d·论文·音视频·视频生成
●VON10 小时前
AI不能做什么?澄清常见误解
人工智能
数据堂官方账号11 小时前
行业洞见 | AI鉴伪:数据驱动的数字安全变革
人工智能·安全
能鈺CMS11 小时前
内容付费系统全面解析:构建知识变现体系的最强工具(2025 SEO 深度专题)
大数据·人工智能·html
魁首11 小时前
AI Agent 协议演进:从 MCP 到 ACP 的架构对比与未来展望
openai·gemini·mcp
Salt_072811 小时前
DAY 19 数组的常见操作和形状
人工智能·python·机器学习