就在今天，OpenAI推特发布了一条非常炸裂的消息，正式发布了text-to-video文字生成视频的模型sora。这可能是近半年最具颠覆性的技术革命，因为它真正实现了视频的创造，而非runway之类只能生成数秒小范围运动轨迹的AI视频技术。从OpenAI最新上线的产品页介绍来看，Sora 可以创建长达 60 秒的视频，其中包含高度详细的场景、复杂的摄像机运动以及充满活力的情感的多个角色。

这意味着手握公认最强大模型ChatGPT的OpenAI又一次给了市场不小的震撼，废话不多说，我们看下sora具备哪些能力。

Sora能力介绍

对语言深入理解，准确根据提示进行视频进行生成

该模型对语言有深入的理解，使其能够准确地解释提示并生成引人注目的字符来表达充满活力的情感

提示：一位时尚女性走在充满温暖霓虹灯和动画城市标牌的东京街道上。她穿着黑色皮夹克、红色长裙和黑色靴子，拎着黑色钱包。她戴着太阳镜，涂着红色口红。她走路自信又随意。街道潮湿且反光，在彩色灯光的照射下形成镜面效果。许多行人走来走去。

根据OpenAI官网介绍，

具备生成多角色，并且根据特定的运动类型和背景描述进行视频生成

Sora 能够生成具有多个角色、特定类型的运动以及主体和背景的准确细节的复杂场景。该模型不仅了解用户在提示中提出的要求，还了解这些东西在物理世界中的存在方式。

如以下两个根据提示生成的视频：

提示：镜头跟随一辆带有黑色车顶行李架的白色老式SUV，它在陡峭的山坡上一条被松树环绕的陡峭土路上加速行驶，轮胎扬起灰尘，阳光照射在SUV上行驶土路，给整个场景投射出温暖的光芒。土路缓缓地蜿蜒延伸至远方，看不到其他汽车或车辆。道路两旁都是红杉树，零星散落着一片片绿意。从后面看，这辆车轻松地沿着曲线行驶，看起来就像是在崎岖的地形上行驶。土路周围是陡峭的丘陵和山脉，上面是清澈的蓝天和缕缕云彩。