全球 AI 视频大战升级!「中国版 Sora」Vidu Q2 参考生月底发布,能力对标 Sora 2

【新智元导读】三天登顶美区 App Store,Sora 2 用「Cameo 客串」再造狂潮;可别忘了,更早提出「Reference 参考生」的国产 AI 视频 Vidu 也即将在本月底升级 Vidu Q2 参考生功能。在一致性、运镜理解、动作连贯三大维度上,看看谁才是下一代 AI 视频的领航者?

OpenAI 再掀全球狂欢,Sora 2 三天登顶美区 App Store,再造一个 ChatGPT 时刻。

用户只需要输入文字提示,Sora 就能生成几乎任何你能想象到的视频片段。

特别是,Sora 2 Cameo 功能让奥特曼客串各种梗图,全网彻底玩疯了奥特曼。

左右滑动查看

奥特曼表示虽然信息流里出现的自己的梗图,没想象中奇怪,但仍有些迷惑。

尽管看起来这场让国外狂欢的盛宴来得突然,实际上类似 Sora 2 Cameo 功能,则在国内并不鲜见,以中国版「Sora」Vidu 为例,作为全球「参考生」功能概念的首个提出者,它与 Cameo 如出一辙。

几乎同时,Vidu 也被曝「参考生视频」功能,将在本月底迎来 Q2 版本的重大更新。

不过,该功能目前仍处于保密内测阶段。基于拿到的第一手内测,我们尝试进行同样内容制作,比如,参考奥特曼形象,Vidu Q2 可生成奥特曼在工业风阁楼中作画的场景------

@黑暗游侠

0-1s 镜头 1,头发飘扬,拉开弓,超近特写,背景是黑暗森林闪着奇幻的光,箭射出去。切镜头

1-6s 镜头 2,黑暗游拿着弓在黑暗森林里快速跑动跳跃,镜头自由跟随,特写全身自由切换,在树林中穿梭,急速大幅度不断跳跃,闪烁。切镜头

6-8s 镜头 3,一个旋转镜头环绕人脸慢动作特写,露出邪魅的笑容

月底突袭,Sora 2 真正挑战者来了

如今,AI 视频生成领域,已成为科技巨头们「打得不可开交」的又一大主战场。

谷歌 Veo 3、OpenAI Sora 2,以及马斯克 xAI 最新放出的 Imagine v0.9,均在音画同步、人物一致性等方面,掀起一波又一波的创新狂潮。

左右滑动查看

反观国内,以 Vidu、Wan2.5、Kling AI 等自主研发的模型强势出击,不仅在技术指标上紧咬对手,更在开放性、成本控制、应用普惠上实现弯道超车。

就在本月底,Vidu Q2 将重新定义「参考生视频」,该功能模型即将迎来一次重大升级。

这无疑是 2025 年视频生成领域,最值得期待的更新之一。

凭借更高的创作自由度、更精细的控制力、更丰富的应用,Vidu 在表情变化、推拉运镜、生成速度,语义理解,视频延长方面取得突破性进展。

这场逆袭,再次证明了国产 AI 的全球竞争力------从跟跑走向领跑,正重塑 AI 版图。

这一次,我们将见证全球视频 AI「大战」的下一个关键节点。

让我们拭目以待。

相关推荐
lifallen1 分钟前
从零推导一个现代 ReAct Agent框架
人工智能·算法·语言模型
我的offer在哪里1 分钟前
腾讯 Ardot 深度博客:AI 重构 UI/UX 全链路,从 “描述即界面” 到设计工业化的腾讯范式
人工智能·ui·重构
AEIC学术交流中心1 分钟前
【快速EI检索 | IEEE出版】第六届信号图像处理与通信国际学术会议(ICSIPC 2026)
图像处理·人工智能
康世行3 分钟前
IDEA集成AI辅助工具推荐(好用不卡顿)
java·人工智能·intellij-idea
柯儿的天空3 分钟前
【OpenClaw 全面解析:从零到精通】第007篇:流量枢纽——OpenClaw Gateway 网关深度解析
人工智能·gpt·ai作画·gateway·aigc·ai编程·ai写作
人道领域3 分钟前
2026年Q1大模型深度复盘:OpenAI,Gemini2.0,字节跳动,与“多模态Agent”元年
人工智能·ai·google·chatgpt·gemini
前端摸鱼匠4 分钟前
大模型面试题1:简述大模型(LLM)的定义,与传统NLP模型的核心区别是什么?
人工智能·ai·语言模型·自然语言处理·面试·职场和发展
光锥智能4 分钟前
AI风越大,云计算越贵
人工智能·云计算
小鹿软件办公6 分钟前
谷歌目前正在测试原生 Mac 版 Gemini 客户端
人工智能·gemini
Deepoch6 分钟前
Deepoc具身模型开发板:构建机械臂柔性制造的通用“神经中枢”
人工智能·科技·机械臂·具身模型·deepoc