刚刚,谷歌深夜上新 Veo 3.1!网友狂刷 2.75 亿条,Sora 2 要小心了

「【新智元导读】谷歌凌晨更新 Veo 3.1,主打更强叙事与音频控制、首尾帧与多图参考等精控,接入 Gemini API 与 Vertex AI,Flow 与 Gemini 可用。可合成多人物场景、音画同步,片段最长约 148 秒;规格至 1080p/24fps。」

刚刚,谷歌在今天凌晨更新了旗舰视频生成模型 Veo 3.1。

Veo 3.1 技术规格上支持输出 720p 或 1080p 分辨率的视频,帧率为 24 帧 / 秒(fps)。

视频时长可选 4 秒、6 秒或 8 秒,若使用 Extend 功能,视频最长可扩展至 148 秒。

各位觉得 Veo 3.1 的效果能不能打过 Sora 2 呢?

这次的 Veo 3.1 更像「功能小升级」------新增首尾帧、多图参考等控制。

但成片质感较 Veo 3 进步有限,甚至略微显得有点「假」。

原生时长仍只有 8 秒,Flow 延长至 30 秒画面偶有衔接,音频提升其实很一般。

基础物理表现比过去好些,但一遇到人物表演与复杂调度还是会露馅。

但这个只是 Veo 3->Veo 3.1 的一次微调。

期待一下谷歌年底的大招,估计会配合 Gemini 3 全家桶发布。

参考资料:

x.com/GoogleDeepM...

相关推荐
老吴学AI3 分钟前
系列报告十二:(HAI) What workers really want from AI?
人工智能
喜欢吃豆4 分钟前
LangChain 架构深度解析:从中间件机制到人机协同 SQL 智能体实战报告
人工智能·中间件·架构·langchain·大模型
Mintopia5 分钟前
如何结合 AI,为未来社交群体构建「信任桥梁」
人工智能·react native·架构
电商API_1800790524710 分钟前
大麦网API实战指南:关键字搜索与详情数据获取全解析
java·大数据·前端·人工智能·spring·网络爬虫
蚍蜉撼树谈何易10 分钟前
一、语音识别基础(1.1 语音特征的提取)
人工智能·语音识别
线束线缆组件品替网10 分钟前
Conxall 防水线缆在户外工控中的布线实践
运维·人工智能·汽车·电脑·材料工程·智能电视
皇族崛起17 分钟前
【视觉多模态】基于视觉AI的人物轨迹生成方案
人工智能·python·计算机视觉·图文多模态·视觉多模态
dundunmm20 分钟前
【每天一个知识点】本体论
人工智能·rag·本体论
nimadan1221 分钟前
**免费有声书配音软件2025推荐,高拟真度AI配音与多场景
人工智能·python
jkyy201427 分钟前
汽车×大健康融合:智慧健康监测座舱成车企新赛道核心布局
大数据·人工智能·物联网·汽车·健康医疗