【不讲废话系列】Sora是个啥?怎么申请?优势、影响和机会!

前言

在2024年2月16号,OpenAI宣布推出全新的生成式人工智能模型Sora。通过目前各大网站所提供的资料,我们可以很直观的理解为:Sora就是通过简单的文字指令生成一条长达60秒的视频,而视频中包含丰富细致的背景、多角度的镜头以及栩栩如生的角色。

这项技术的推出标志着OpenAI在AI领域的又一次突破,目前所了解的人工智能技术已经不仅仅局限于文字、图像,还扩展到了视频领域。

OpenAI表示:Sora具备理解和模拟现实世界的能力,这是实现AGI的重要里程碑

Sora是个啥?

以下内容翻译OpenAI官方发布的Sora技术报告,原文链接

Sora 模型基于 Transformer 架构,建立在 DALL·E3GPT 模型之上,使用文本到视频的合成技术,按文本提示生成视频。这种技术将自然语言转换为视觉表示形式------图像或视频。

OpenAI 在官网展示 Sora 的生成逻辑

  • 深度神经网络依然是 Sora 的基础,它是一个带有 Transformer 骨架的扩散(Diffusion)模型,AI 从数据中学习并执行复杂的任务。Sora 就是从"学习"的大型视频数据集里学会了各种风格、主题和流派。

  • Transformer 模型本质是一个编码器-解码器,输入原始语言,生成目标语言。扩散模型的原理是先给数据添加高斯噪声,再反向去除,从中恢复数据本貌。

  • 简单粗暴地理解 Sora 的原理,就是翻译器+搜索引擎+概率制作(内容)。

  • 首先,拿到提示词后,Sora 先分析文本,提取关键字,比如主题、动作、地点、时间和情绪,再从它的数据集里搜索与关键字匹配的、最合适的视频。

  • 其次,Sora 将数据集里合适的视频混合在一起,重新创建一个符合要求的视频。在"创造"的过程中,它要"知道"场景中有哪些对象和角色,它们的外形,它们如何运动,对象如何交互,以及受到环境影响后如何表现。

  • 根据用户的喜好,Sora 会修改视频的风格。假如用户想要一个 35 毫米胶片样式的视频,Sora 会调整效果,更改图像的亮度、色彩和摄像机角度。这一点和 Midjourney 等"文生图"应用类似。

  • Sora 可以生成分辨率 1920x1080 的视频,也可以基于静止图片创建视频,使用新素材扩展现有素材。比如用户给它一张森林图片,它可以帮你加上鸟、兽、人。给它一张汽车行驶图,它能加上道路、交通灯、沿途建筑物和风景。

Sora怎么申请?

截止2024年2月27号,OpenAI目前还没有针对Sora进行公开测试,也没有内测申请渠道,下面有两条关于openAI内测申请的信息源,不一定真实,大家仅供参考。

1、OpenAI官方论坛,加入论坛有机会获得内测资格

2、Red Team 公开招募,要求比较高

可能是有人在X上看到一些传言之后发布出来的两条申请渠道,大家仅供参考,不可相信网上199元带你玩转Sora的课程。

Sora的优势

优势 描述
精确多样 Sora能准确理解你输入长达135个文字的指示,你只需要简单描述即可让它制作出各种各样的高清视频,场景从人 - 动物 - 美景 - 游戏场景都可以轻松搞定。
超强理解 Dall-E的技术引入,可以让Sora更准确的理解文字指令,并且根据文本内容提高视频质量,加上GPT的技术辅助,还能让我们的简单描述变成更消息的指令,这样Sora就能生成更高质量的视频。
图片视频都能搞 除了文生视频,Sora还能处理图片和视频的输入,比如视频循环、静态照片变成动画,还能延长和缩短视频。由此可见Sora在编辑领域的超大潜力。
视频扩展功能 Sora可以根据不同的输入提示创建和扩展视频,也就是在剪映中常见的视频时间轴的基础上向前or向后延伸视频。(PS之前的AI支持图片扩展功能哦~)
设备适配性强 从官方视频中可见Sora能够适应各种视频尺寸,无论宽屏还是竖屏都可以轻松生成。
自然连贯 Sora能生成带有动态视角变化的视频,让任务和场景看起来更加的自然。

Sora的影响

以下仅为个人思考,若有不足可以补充

  1. 最直接的可能会影响到影视行业,一些特效or高危镜头可能不会花太多钱和时间去拍摄、剪辑、制作。
  2. 对于现在大热的短视频行业来说,也是一件利好消息,可以用AI来代替繁琐的剪辑工作。
  3. 除了视频之外,还需要有一个好的剧本才行,能让Sora生成一段好的视频需要一个更好的编剧来写脚本(当然这里可以用chatGPT辅助)。
  4. 如果Sora真的发展到一定地步之后,一些缅北诈骗犯可能会做一些视频来做不法勾当了。(毕竟之前出现过一张照片只让嘴动,并配音进行诈骗的新闻)

未来具体会发展成什么样,等待Sora正式发布时会不会翻车,我们都不得而知,所以静静的让子弹飞一会儿

Sora带来的机会

机会是留给有准备的人,行动才是最好的机会。

  1. 卖课:199元带你玩转Sora的一舟已经被央视点名了。
  2. 投资:目前国内大A对于AI行业还是有不少利好消息的(投资需谨慎)
  3. 视频制作:写一份好的剧本,做一个属于自己的IP视频
  4. 提示词交易:类似于去年初的文生图、图生图等,都有自己的提示词网站
  5. Sora+电商:根据产品去生成图、生成视频,直接用AI模特穿上店铺新衣来进行展示

大佬讲解

点击查看周鸿祎微博主页

点击查看胡锡进微博原文

点击查看新闻联播公众号内容

相关推荐
hunteritself2 天前
ChatGPT高级语音模式正在向Web网页端推出!
人工智能·gpt·chatgpt·openai·语音识别
Swift社区4 天前
使用 AI 在医疗影像分析中的应用探索
typescript·tensorflow·openai
hunteritself4 天前
ChatGPT Search VS Kimi探索版:AI搜索哪家强?!
人工智能·gpt·chatgpt·openai·xai
Icried6 天前
使用React 实现一个简单的待办事项列表|青训营笔记:方向三
前端·openai
hunteritself8 天前
谷歌Gemini发布iOS版App,live语音聊天免费用!
人工智能·ios·chatgpt·openai·语音识别
OneFlow深度学习框架9 天前
LLM长上下文RAG能力实测:GPT o1 vs Gemini
gpt·语言模型·大模型·openai·gemini·o1
JarodYv10 天前
GPT-5 要来了:抢先了解其创新突破
gpt·openai·生成式ai·gpt-4·gpt-5
hunteritself11 天前
Sam Altman:年底将有重磅更新,但不是GPT-5!
人工智能·gpt·深度学习·chatgpt·openai·语音识别
Code_Artist14 天前
Spring AI: Make Spring Great Again!设计并实现一款智能Chat Bot!
后端·llm·openai
毅航14 天前
从原理到实践,构建属于自己的AI客服机器人
人工智能·后端·openai