【不讲废话系列】Sora是个啥?怎么申请?优势、影响和机会!

前言

在2024年2月16号,OpenAI宣布推出全新的生成式人工智能模型Sora。通过目前各大网站所提供的资料,我们可以很直观的理解为:Sora就是通过简单的文字指令生成一条长达60秒的视频,而视频中包含丰富细致的背景、多角度的镜头以及栩栩如生的角色。

这项技术的推出标志着OpenAI在AI领域的又一次突破,目前所了解的人工智能技术已经不仅仅局限于文字、图像,还扩展到了视频领域。

OpenAI表示:Sora具备理解和模拟现实世界的能力,这是实现AGI的重要里程碑

Sora是个啥?

以下内容翻译OpenAI官方发布的Sora技术报告,原文链接

Sora 模型基于 Transformer 架构,建立在 DALL·E3GPT 模型之上,使用文本到视频的合成技术,按文本提示生成视频。这种技术将自然语言转换为视觉表示形式------图像或视频。

OpenAI 在官网展示 Sora 的生成逻辑

  • 深度神经网络依然是 Sora 的基础,它是一个带有 Transformer 骨架的扩散(Diffusion)模型,AI 从数据中学习并执行复杂的任务。Sora 就是从"学习"的大型视频数据集里学会了各种风格、主题和流派。

  • Transformer 模型本质是一个编码器-解码器,输入原始语言,生成目标语言。扩散模型的原理是先给数据添加高斯噪声,再反向去除,从中恢复数据本貌。

  • 简单粗暴地理解 Sora 的原理,就是翻译器+搜索引擎+概率制作(内容)。

  • 首先,拿到提示词后,Sora 先分析文本,提取关键字,比如主题、动作、地点、时间和情绪,再从它的数据集里搜索与关键字匹配的、最合适的视频。

  • 其次,Sora 将数据集里合适的视频混合在一起,重新创建一个符合要求的视频。在"创造"的过程中,它要"知道"场景中有哪些对象和角色,它们的外形,它们如何运动,对象如何交互,以及受到环境影响后如何表现。

  • 根据用户的喜好,Sora 会修改视频的风格。假如用户想要一个 35 毫米胶片样式的视频,Sora 会调整效果,更改图像的亮度、色彩和摄像机角度。这一点和 Midjourney 等"文生图"应用类似。

  • Sora 可以生成分辨率 1920x1080 的视频,也可以基于静止图片创建视频,使用新素材扩展现有素材。比如用户给它一张森林图片,它可以帮你加上鸟、兽、人。给它一张汽车行驶图,它能加上道路、交通灯、沿途建筑物和风景。

Sora怎么申请?

截止2024年2月27号,OpenAI目前还没有针对Sora进行公开测试,也没有内测申请渠道,下面有两条关于openAI内测申请的信息源,不一定真实,大家仅供参考。

1、OpenAI官方论坛,加入论坛有机会获得内测资格

2、Red Team 公开招募,要求比较高

可能是有人在X上看到一些传言之后发布出来的两条申请渠道,大家仅供参考,不可相信网上199元带你玩转Sora的课程。

Sora的优势

优势 描述
精确多样 Sora能准确理解你输入长达135个文字的指示,你只需要简单描述即可让它制作出各种各样的高清视频,场景从人 - 动物 - 美景 - 游戏场景都可以轻松搞定。
超强理解 Dall-E的技术引入,可以让Sora更准确的理解文字指令,并且根据文本内容提高视频质量,加上GPT的技术辅助,还能让我们的简单描述变成更消息的指令,这样Sora就能生成更高质量的视频。
图片视频都能搞 除了文生视频,Sora还能处理图片和视频的输入,比如视频循环、静态照片变成动画,还能延长和缩短视频。由此可见Sora在编辑领域的超大潜力。
视频扩展功能 Sora可以根据不同的输入提示创建和扩展视频,也就是在剪映中常见的视频时间轴的基础上向前or向后延伸视频。(PS之前的AI支持图片扩展功能哦~)
设备适配性强 从官方视频中可见Sora能够适应各种视频尺寸,无论宽屏还是竖屏都可以轻松生成。
自然连贯 Sora能生成带有动态视角变化的视频,让任务和场景看起来更加的自然。

Sora的影响

以下仅为个人思考,若有不足可以补充

  1. 最直接的可能会影响到影视行业,一些特效or高危镜头可能不会花太多钱和时间去拍摄、剪辑、制作。
  2. 对于现在大热的短视频行业来说,也是一件利好消息,可以用AI来代替繁琐的剪辑工作。
  3. 除了视频之外,还需要有一个好的剧本才行,能让Sora生成一段好的视频需要一个更好的编剧来写脚本(当然这里可以用chatGPT辅助)。
  4. 如果Sora真的发展到一定地步之后,一些缅北诈骗犯可能会做一些视频来做不法勾当了。(毕竟之前出现过一张照片只让嘴动,并配音进行诈骗的新闻)

未来具体会发展成什么样,等待Sora正式发布时会不会翻车,我们都不得而知,所以静静的让子弹飞一会儿

Sora带来的机会

机会是留给有准备的人,行动才是最好的机会。

  1. 卖课:199元带你玩转Sora的一舟已经被央视点名了。
  2. 投资:目前国内大A对于AI行业还是有不少利好消息的(投资需谨慎)
  3. 视频制作:写一份好的剧本,做一个属于自己的IP视频
  4. 提示词交易:类似于去年初的文生图、图生图等,都有自己的提示词网站
  5. Sora+电商:根据产品去生成图、生成视频,直接用AI模特穿上店铺新衣来进行展示

大佬讲解

点击查看周鸿祎微博主页

点击查看胡锡进微博原文

点击查看新闻联播公众号内容

相关推荐
营赢盈英10 小时前
Give azure openai an encyclopedia of information
ai·openai·azure
Snowbowღ14 小时前
OpenAI / GPT-4o:Python 返回结构化 / JSON 输出
python·json·openai·api·gpt-4o·pydantic·结构化输出
营赢盈英1 天前
Allow anonymous access to my Azure OpenAI chat bot
ai·openai·azure·webapps
网络研究院3 天前
解码 OpenAI 的 o1 系列大型语言模型
人工智能·语言模型·自然语言处理·openai·技术·推理·能力
营赢盈英3 天前
OpenAI GPT-3 API error: “You must provide a model parameter“
chatgpt·gpt-3·openai·swift
营赢盈英3 天前
OpenAI API key not working in my React App
javascript·ai·openai·reactjs·chatbot
营赢盈英3 天前
Using OpenAI API from Firebase Cloud Functions in flutter app
ai·node.js·openai·googlecloud·firebase
营赢盈英5 天前
404 error when doing workload anlysis using locust on OpenAI API (GPT.35)
人工智能·python·openai·locust
CaiYongji6 天前
深度!程序员生涯的垃圾时间(上)
人工智能·gpt·chatgpt·openai
营赢盈英7 天前
How to see if openAI (node js) createModeration response “flagged“ is true
javascript·ai·node.js·openai·api