全球 AI 视频大战升级!「中国版 Sora」Vidu Q2 参考生月底发布,能力对标 Sora 2

【新智元导读】三天登顶美区 App Store,Sora 2 用「Cameo 客串」再造狂潮;可别忘了,更早提出「Reference 参考生」的国产 AI 视频 Vidu 也即将在本月底升级 Vidu Q2 参考生功能。在一致性、运镜理解、动作连贯三大维度上,看看谁才是下一代 AI 视频的领航者?

OpenAI 再掀全球狂欢,Sora 2 三天登顶美区 App Store,再造一个 ChatGPT 时刻。

用户只需要输入文字提示,Sora 就能生成几乎任何你能想象到的视频片段。

特别是,Sora 2 Cameo 功能让奥特曼客串各种梗图,全网彻底玩疯了奥特曼。

左右滑动查看

奥特曼表示虽然信息流里出现的自己的梗图,没想象中奇怪,但仍有些迷惑。

尽管看起来这场让国外狂欢的盛宴来得突然,实际上类似 Sora 2 Cameo 功能,则在国内并不鲜见,以中国版「Sora」Vidu 为例,作为全球「参考生」功能概念的首个提出者,它与 Cameo 如出一辙。

几乎同时,Vidu 也被曝「参考生视频」功能,将在本月底迎来 Q2 版本的重大更新。

不过,该功能目前仍处于保密内测阶段。基于拿到的第一手内测,我们尝试进行同样内容制作,比如,参考奥特曼形象,Vidu Q2 可生成奥特曼在工业风阁楼中作画的场景------

@黑暗游侠

0-1s 镜头 1,头发飘扬,拉开弓,超近特写,背景是黑暗森林闪着奇幻的光,箭射出去。切镜头

1-6s 镜头 2,黑暗游拿着弓在黑暗森林里快速跑动跳跃,镜头自由跟随,特写全身自由切换,在树林中穿梭,急速大幅度不断跳跃,闪烁。切镜头

6-8s 镜头 3,一个旋转镜头环绕人脸慢动作特写,露出邪魅的笑容

月底突袭,Sora 2 真正挑战者来了

如今,AI 视频生成领域,已成为科技巨头们「打得不可开交」的又一大主战场。

谷歌 Veo 3、OpenAI Sora 2,以及马斯克 xAI 最新放出的 Imagine v0.9,均在音画同步、人物一致性等方面,掀起一波又一波的创新狂潮。

左右滑动查看

反观国内,以 Vidu、Wan2.5、Kling AI 等自主研发的模型强势出击,不仅在技术指标上紧咬对手,更在开放性、成本控制、应用普惠上实现弯道超车。

就在本月底,Vidu Q2 将重新定义「参考生视频」,该功能模型即将迎来一次重大升级。

这无疑是 2025 年视频生成领域,最值得期待的更新之一。

凭借更高的创作自由度、更精细的控制力、更丰富的应用,Vidu 在表情变化、推拉运镜、生成速度,语义理解,视频延长方面取得突破性进展。

这场逆袭,再次证明了国产 AI 的全球竞争力------从跟跑走向领跑,正重塑 AI 版图。

这一次,我们将见证全球视频 AI「大战」的下一个关键节点。

让我们拭目以待。

相关推荐
sali-tec2 小时前
C# 基于halcon的视觉工作流-章56-彩图转云图
人工智能·算法·计算机视觉·c#
梦想画家2 小时前
基于PyTorch的时间序列异常检测管道构建指南
人工智能·pytorch·python
Elastic 中国社区官方博客3 小时前
在 Elasticsearch 中使用 Mistral Chat completions 进行上下文工程
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
一碗绿豆汤3 小时前
机器学习第二阶段
人工智能·机器学习
用什么都重名3 小时前
DeepSeek-OCR 深度解析
人工智能·ocr·deepseek-ocr
河南骏4 小时前
RAG_检索进阶
人工智能·深度学习
灯火不休时5 小时前
95%准确率!CNN交通标志识别系统开源
人工智能·python·深度学习·神经网络·cnn·tensorflow
mit6.8245 小时前
[手机AI开发sdk] Aid_code IDE | PC浏览器同步访问
ide·人工智能·智能手机
deephub5 小时前
FastMCP 入门:用 Python 快速搭建 MCP 服务器接入 LLM
服务器·人工智能·python·大语言模型·mcp
番石榴AI6 小时前
基于机器学习优化的主图选择方法(酒店,景点,餐厅等APP上的主图展示推荐)
图像处理·人工智能·python·机器学习