Sora背后团队大揭秘!天才00后?

现在世界上最受关注的技术团队是哪一支?

Sora 团队,已经来到聚光灯中心。

不仅项目负责人评论区被挤爆,成了𝕏最火"景点"

当 OpenAI 出手发布 Sora 之后,给人一种降维打击的感觉 ------ 效果和之前的技术相比高出了几个档次。这就难免会让人好奇,到底是什么样的人才能做出这样炸裂的工具的呢?今天我们就来盘点一下Sora背后的团队成员。


这些参与者中,已知的核心成员包括研发负责人: Tim Brooks、Bill Peebles、系统负责人: Connor Holmes 等。这些成员的信息也成为了众人关注的焦点。

重点来介绍一下Sora的几位主要负责人,包括 Tim 和 Bill 在内,Sora 的主要负责人一共有三名(以下排名不分先后)


Sora的总负责人Tim Brooks,博士毕业于 UC Berkeley 的「伯克利人工智能研究所」BAIR,导师为 Alyosha Efros。

Tim 本科就读于卡内基梅隆大学,主修逻辑与计算,辅修计算机科学,其间在 Facebook 软件工程部门实习了四个月。

2017 年,本科毕业的 Tim 先到 Google 工作了近两年,在 Pixel 手机部门中研究 AI 相机,之后到了伯克利 AI 实验室攻读博士。

在伯克利读博期间,Tim 的主要研究方向就是图片与视频生成,他还在英伟达实习并主导了一项关于视频生成的研究。

回到校园后,Tim 与导师 Alexei Efros 教授和同组博士后 Aleksander Holynski(现在谷歌)一起研制了 AI 图片编辑工具 InstructPix2Pix,并入选 CVPR 2023 Highlight。

​编辑

Tim在X上的社交帐号上发布了Sora的视频,评论区也是热潮不断,彻底的引爆了24年初的话题

23年1月,Tim 顺利毕业并取得了博士学位,加入了 OpenAI,并且参与了 DALL-E 3 的工作

除了业务能力在线之外,Tim 还是个多才多艺的人。

据 Tim 自己介绍,他还喜欢摄影和音乐,高中时他拍摄的照片获得过 National Geographic 颁发的奖项,本人到过百老汇演出,还获得过 B-box 国际奖项


而与 Tim 师出同门、的 William Peebles,也是 Sora 的另一名负责人。他在 2023 年刚刚获得博士学位,同样也是 Alyosha Efros 的学生。在本科时,Peebles 就读于麻省理工,师从 Antonio Torralba。

Bill 主修计算机科学,参加了 GAN 和 text2video 的研究,还在英伟达深度学习与自动驾驶团队实习,研究计算机视觉。 其发表的论文《Scalable diffusion models with transformers》,入选了计算机视觉顶会 ICCV 2023。这篇论文提出了一种基于 transformer 架构的新型扩散模型即 DiT。在该研究中,研究者训练了潜在扩散模型,用对潜在 patch 进行操作的 Transformer 替换常用的 U-Net 主干网络。他们通过以 Gflops 衡量的前向传递复杂度来分析扩散 Transformer (DiT) 的可扩展性。

论文链接:https://arxiv.org/abs/2212.09748

Bill在X上的社交帐号同样也是赞声一片,大家对Sora这款大模型都抱有着巨大的期待,目前Sora还没有正式的发布,预计可能在四月中旬左右发布,目前据说只有1000个内测名额,且获取资格的要求非常严格,并且用Sora制作的视频不能够外传,现在我们只需要静静地等待它正式发布


Connor Holmes,他是Sora的系统负责人,毕业于科罗拉多矿业大学,电气电子工程学士、高性能计算博士,他在微软工作时以外援形式参与了 DALL・E 3 的推理优化工作,后来直接加入 了OpenAI 。


目前Sora 团队的不少成员都是 DALL-E 3 的作者,包括两位华人 Li Jing 和 Yufei Guo。

Li Jing 是 DALL-E 3 的共同一作,2014 年本科毕业于北京大学物理系,2019 年获得 MIT 物理学博士学位。在 Meta 做了 2 年多博士后之后,Li Jing 于 2022 年加入 OpenAI。

华人作者中还有 Ricky Wang,今年一月刚刚从 Meta / Instagram 跳槽到 OpenAI,另外两位 Yufei Guo、Clarence Ng 没有太多公开资料。

从团队的组建情况和研究基础来看,Sora 应该是 OpenAI短期内的研究成果,毕竟是在Dell-3的基础上展开的研究,并非网传Sora历经了至少一年的的研究。

从ChatGPT到文生图,再到文生视频,那下一个又会是什么呢?

相关推荐
itmrl2 天前
OpenAI 推出账户高级安全功能:抗钓鱼登录与强化恢复机制
openai·身份认证·账户安全·passkey·抗钓鱼
星浩AI2 天前
OpenAI 大神 Karpathy 开源:用 Obsidian 实现 LLM Wiki 知识库管理方法
后端·openai·agent
小蠢驴打代码2 天前
我做了一个工具:一键同步 Claude Code、Cursor、Codex 的 MCP 和 Skills 配置
openai·claude·cursor
程序员老廖2 天前
B站最强的GPT 5.5与Opus 4.7对比测试,重点评估GPT-5.5与Opus 4.7在性能、价格和响应速度等方面的差异
openai
山间小僧2 天前
「AI学习笔记」万恶之源《Attention is all you need》
后端·openai·ai编程
巴糖3 天前
AI大模型:语言模型训练范式-04近端策略优化(PPO)
openai
Luca_kill3 天前
GPT Image 2 深度评测:当 AI 图像生成跨越“图灵测试”,它如何重塑开发者工作流?
人工智能·深度学习·openai·ai图像生成·gpt image 2
卷积殉铁子3 天前
OpenClaw不装了,GPT-6硬刚:谁能拿下未来5年AI红利?
人工智能·aigc·openai
机器之心4 天前
Generalist之后,罗剑岚团队推出LWD,也要变革具身智能训练范式
人工智能·openai
clarance20184 天前
深度解析小米MiMo-V2.5:1T参数MoE架构与智能体能力实战
openai