刚刚,谷歌深夜上新 Veo 3.1!网友狂刷 2.75 亿条,Sora 2 要小心了

「【新智元导读】谷歌凌晨更新 Veo 3.1,主打更强叙事与音频控制、首尾帧与多图参考等精控,接入 Gemini API 与 Vertex AI,Flow 与 Gemini 可用。可合成多人物场景、音画同步,片段最长约 148 秒;规格至 1080p/24fps。」

刚刚,谷歌在今天凌晨更新了旗舰视频生成模型 Veo 3.1。

Veo 3.1 技术规格上支持输出 720p 或 1080p 分辨率的视频,帧率为 24 帧 / 秒(fps)。

视频时长可选 4 秒、6 秒或 8 秒,若使用 Extend 功能,视频最长可扩展至 148 秒。

各位觉得 Veo 3.1 的效果能不能打过 Sora 2 呢?

这次的 Veo 3.1 更像「功能小升级」------新增首尾帧、多图参考等控制。

但成片质感较 Veo 3 进步有限,甚至略微显得有点「假」。

原生时长仍只有 8 秒,Flow 延长至 30 秒画面偶有衔接,音频提升其实很一般。

基础物理表现比过去好些,但一遇到人物表演与复杂调度还是会露馅。

但这个只是 Veo 3->Veo 3.1 的一次微调。

期待一下谷歌年底的大招,估计会配合 Gemini 3 全家桶发布。

参考资料:

x.com/GoogleDeepM...

相关推荐
ccLianLian2 分钟前
计算机视觉·TagCLIP
人工智能·算法
aneasystone本尊8 分钟前
重温 Java 21 之虚拟线程
人工智能
geneculture9 分钟前
官学商大跨界 · 产学研大综合:融智学新范式应用体系
大数据·人工智能·物联网·数据挖掘·哲学与科学统一性·信息融智学
这张生成的图像能检测吗12 分钟前
(综述)基于深度学习的制造业表面缺陷检测图像合成方法综述
人工智能·计算机视觉·图像生成·工业检测·计算机图像学
草莓熊Lotso14 分钟前
C++ 继承特殊场景解析:友元、静态成员与菱形继承的底层逻辑
服务器·开发语言·c++·人工智能·经验分享·笔记·1024程序员节
安如衫14 分钟前
【学习笔记更新中】Deeplearning.AI 大语言模型后训练:微调与强化学习导论
人工智能·llm·sft·后训练·deepseek
IT_陈寒25 分钟前
5个Python 3.12新特性让你的代码效率提升50%,第3个太实用了!
前端·人工智能·后端
love is sour26 分钟前
理解全连接层:深度学习中的基础构建块
人工智能·深度学习
周杰伦_Jay27 分钟前
【Python后端API开发对比】FastAPI、主流框架Flask、Django REST Framework(DRF)及高性能框架Tornado
数据结构·人工智能·python·django·flask·fastapi·tornado
chenchihwen37 分钟前
AI代码开发宝库系列:PDF文档解析MinerU
人工智能·python·pdf·dashscope