刚刚,谷歌深夜上新 Veo 3.1!网友狂刷 2.75 亿条,Sora 2 要小心了

「【新智元导读】谷歌凌晨更新 Veo 3.1,主打更强叙事与音频控制、首尾帧与多图参考等精控,接入 Gemini API 与 Vertex AI,Flow 与 Gemini 可用。可合成多人物场景、音画同步,片段最长约 148 秒;规格至 1080p/24fps。」

刚刚,谷歌在今天凌晨更新了旗舰视频生成模型 Veo 3.1。

Veo 3.1 技术规格上支持输出 720p 或 1080p 分辨率的视频,帧率为 24 帧 / 秒(fps)。

视频时长可选 4 秒、6 秒或 8 秒,若使用 Extend 功能,视频最长可扩展至 148 秒。

各位觉得 Veo 3.1 的效果能不能打过 Sora 2 呢?

这次的 Veo 3.1 更像「功能小升级」------新增首尾帧、多图参考等控制。

但成片质感较 Veo 3 进步有限,甚至略微显得有点「假」。

原生时长仍只有 8 秒,Flow 延长至 30 秒画面偶有衔接,音频提升其实很一般。

基础物理表现比过去好些,但一遇到人物表演与复杂调度还是会露馅。

但这个只是 Veo 3->Veo 3.1 的一次微调。

期待一下谷歌年底的大招,估计会配合 Gemini 3 全家桶发布。

参考资料:

x.com/GoogleDeepM...

相关推荐
yuzhuanhei4 小时前
Segment Anything(SAM)
人工智能
做科研的周师兄4 小时前
【机器学习入门】7.4 随机森林:一文吃透随机森林——从原理到核心特点
人工智能·学习·算法·随机森林·机器学习·支持向量机·数据挖掘
lll上4 小时前
三步对接gpt-5-pro!地表强AI模型实测
人工智能·gpt
喜欢吃豆4 小时前
一份关于语言模型对齐的技术论述:从基于PPO的RLHF到直接偏好优化
人工智能·语言模型·自然语言处理·大模型·强化学习
超龄超能程序猿5 小时前
Spring AI Alibaba 与 Ollama对话历史的持久化
java·人工智能·spring
孤狼灬笑5 小时前
机器学习四范式(有监督、无监督、强化学习、半监督学习)
人工智能·强化学习·无监督学习·半监督学习·有监督学习
第七序章5 小时前
【C++】AVL树的平衡机制与实现详解(附思维导图)
c语言·c++·人工智能·机器学习
晨非辰5 小时前
【面试高频数据结构(四)】--《从单链到双链的进阶,读懂“双向奔赴”的算法之美与效率权衡》
java·数据结构·c++·人工智能·算法·机器学习·面试
阿里云大数据AI技术5 小时前
云栖实录 | 通义实验室基于MaxCompute进行大模型数据管理及处理
大数据·人工智能