AI 电影制作迈入新阶段:谷歌云Veo 3.1模型发布,实现音频全覆盖与精细化创意剪辑

目录

[1. Veo 3.1:音频全覆盖与增强真实感](#1. Veo 3.1:音频全覆盖与增强真实感)

[素材转视频(Ingredients to Video)](#素材转视频(Ingredients to Video))

[帧转视频(Frames to Video)](#帧转视频(Frames to Video))

拓展(Extend)

[2. 精细控制:全新的创意剪辑功能](#2. 精细控制:全新的创意剪辑功能)

添加(Insert)功能

移除(Remove)功能(即将推出)

[3. 生态可用性:全平台开放](#3. 生态可用性:全平台开放)

面向开发者

面向企业客户

[Gemini 应用](#Gemini 应用)


谷歌云Veo已生成超过 2.75 亿个视频,用户激发的创造力令人振奋。基于用户的反馈,我们了解到市场对 Flow 的艺术控制能力和音频支持有着强烈的需求。为此,我们推出了全新增强的创意剪辑功能和 Veo 3.1 模型,将 AI 视频制作推向新的高度。

1. Veo 3.1:音频全覆盖与增强真实感

借助 Veo 3.1,我们在 Flow 的核心功能中引入了 AI 生成音频,以帮助用户打造完美的场景和更流畅的叙事。这些功能虽然仍处于实验阶段,但正在积极改进中:

素材转视频(Ingredients to Video)

用户可使用多张参考图像来控制角色、物体和风格,Flow 将利用这些素材,创建出与用户想象中完全一致的最终场景观感。

帧转视频(Frames to Video)

用户只需提供一张起始图像和一张结束图像,Flow 就能生成一段连接两者的无缝视频,非常适合制作富有艺术感和史诗感的转场。

拓展(Extend)

允许用户创建更长、更流畅的镜头,甚至长达一分钟或更久,它能够连接并延续原始片段中的动作,尤其适用于创建更长的定场镜头。

2. 精细控制:全新的创意剪辑功能

新的编辑功能帮助创作者随时随地重新构思和完善场景:

添加(Insert)功能

用户可以向任何场景添加任何想象中的新元素,从逼真的细节到奇幻的生物。Flow 现在可以处理阴影和场景光照等复杂的细节,确保新增元素看起来自然流畅。

移除(Remove)功能(即将推出)

用户将能够从场景中无缝移除不需要的物体或角色,Flow 会重建背景和周围环境,使其看起来仿佛从未存在过。

3. 生态可用性:全平台开放

Veo 3.1模型不仅在Flow工具中可用,还可通过以下平台获取,加速 AI 视频能力的普及:

面向开发者

可通过 Gemini API 获取。

面向企业客户

可通过 Vertex AI 获取。

Gemini 应用

可通过 Gemini 应用 体验。

Veo 3.1 在 Flow 中开启了更丰富、更强大的视频叙事新可能。我们期待看到用户基于这些增强功能进行创造,同时将根据反馈持续进行迭代。

相关推荐
落雨盛夏1 小时前
深度学习|李哥考研4图片分类比较详细说明
人工智能·深度学习·分类
臭东西的学习笔记5 小时前
论文学习——机器学习引导的蛋白质工程
人工智能·学习·机器学习
大王小生5 小时前
说说CSV文件和C#解析csv文件的几种方式
人工智能·c#·csv·csvhelper·csvreader
m0_462605225 小时前
第G3周:CGAN入门|生成手势图像
人工智能
bubiyoushang8886 小时前
基于LSTM神经网络的短期风速预测实现方案
人工智能·神经网络·lstm
中烟创新6 小时前
烟草专卖文书生成智能体与法规案卷评查智能体获评“年度技术最佳实践奖”
人工智能
得一录6 小时前
大模型中的多模态知识
人工智能·aigc
Github掘金计划6 小时前
Claude Work 开源平替来了:让 AI 代理从“终端命令“变成“产品体验“
人工智能·开源
ghgxm5206 小时前
Fastapi_00_学习方向 ——无编程基础如何用AI实现APP生成
人工智能·学习·fastapi
余俊晖7 小时前
3秒实现语音克隆的Qwen3-TTS的Qwen-TTS-Tokenizer和方法架构概览
人工智能·语音识别