Sora背后团队大揭秘!天才00后?

现在世界上最受关注的技术团队是哪一支?

Sora 团队,已经来到聚光灯中心。

不仅项目负责人评论区被挤爆,成了𝕏最火"景点"

当 OpenAI 出手发布 Sora 之后,给人一种降维打击的感觉 ------ 效果和之前的技术相比高出了几个档次。这就难免会让人好奇,到底是什么样的人才能做出这样炸裂的工具的呢?今天我们就来盘点一下Sora背后的团队成员。


这些参与者中,已知的核心成员包括研发负责人: Tim Brooks、Bill Peebles、系统负责人: Connor Holmes 等。这些成员的信息也成为了众人关注的焦点。

重点来介绍一下Sora的几位主要负责人,包括 Tim 和 Bill 在内,Sora 的主要负责人一共有三名(以下排名不分先后)


Sora的总负责人Tim Brooks,博士毕业于 UC Berkeley 的「伯克利人工智能研究所」BAIR,导师为 Alyosha Efros。

Tim 本科就读于卡内基梅隆大学,主修逻辑与计算,辅修计算机科学,其间在 Facebook 软件工程部门实习了四个月。

2017 年,本科毕业的 Tim 先到 Google 工作了近两年,在 Pixel 手机部门中研究 AI 相机,之后到了伯克利 AI 实验室攻读博士。

在伯克利读博期间,Tim 的主要研究方向就是图片与视频生成,他还在英伟达实习并主导了一项关于视频生成的研究。

回到校园后,Tim 与导师 Alexei Efros 教授和同组博士后 Aleksander Holynski(现在谷歌)一起研制了 AI 图片编辑工具 InstructPix2Pix,并入选 CVPR 2023 Highlight。

​编辑

Tim在X上的社交帐号上发布了Sora的视频,评论区也是热潮不断,彻底的引爆了24年初的话题

23年1月,Tim 顺利毕业并取得了博士学位,加入了 OpenAI,并且参与了 DALL-E 3 的工作

除了业务能力在线之外,Tim 还是个多才多艺的人。

据 Tim 自己介绍,他还喜欢摄影和音乐,高中时他拍摄的照片获得过 National Geographic 颁发的奖项,本人到过百老汇演出,还获得过 B-box 国际奖项


而与 Tim 师出同门、的 William Peebles,也是 Sora 的另一名负责人。他在 2023 年刚刚获得博士学位,同样也是 Alyosha Efros 的学生。在本科时,Peebles 就读于麻省理工,师从 Antonio Torralba。

Bill 主修计算机科学,参加了 GAN 和 text2video 的研究,还在英伟达深度学习与自动驾驶团队实习,研究计算机视觉。 其发表的论文《Scalable diffusion models with transformers》,入选了计算机视觉顶会 ICCV 2023。这篇论文提出了一种基于 transformer 架构的新型扩散模型即 DiT。在该研究中,研究者训练了潜在扩散模型,用对潜在 patch 进行操作的 Transformer 替换常用的 U-Net 主干网络。他们通过以 Gflops 衡量的前向传递复杂度来分析扩散 Transformer (DiT) 的可扩展性。

论文链接:https://arxiv.org/abs/2212.09748

Bill在X上的社交帐号同样也是赞声一片,大家对Sora这款大模型都抱有着巨大的期待,目前Sora还没有正式的发布,预计可能在四月中旬左右发布,目前据说只有1000个内测名额,且获取资格的要求非常严格,并且用Sora制作的视频不能够外传,现在我们只需要静静地等待它正式发布


Connor Holmes,他是Sora的系统负责人,毕业于科罗拉多矿业大学,电气电子工程学士、高性能计算博士,他在微软工作时以外援形式参与了 DALL・E 3 的推理优化工作,后来直接加入 了OpenAI 。


目前Sora 团队的不少成员都是 DALL-E 3 的作者,包括两位华人 Li Jing 和 Yufei Guo。

Li Jing 是 DALL-E 3 的共同一作,2014 年本科毕业于北京大学物理系,2019 年获得 MIT 物理学博士学位。在 Meta 做了 2 年多博士后之后,Li Jing 于 2022 年加入 OpenAI。

华人作者中还有 Ricky Wang,今年一月刚刚从 Meta / Instagram 跳槽到 OpenAI,另外两位 Yufei Guo、Clarence Ng 没有太多公开资料。

从团队的组建情况和研究基础来看,Sora 应该是 OpenAI短期内的研究成果,毕竟是在Dell-3的基础上展开的研究,并非网传Sora历经了至少一年的的研究。

从ChatGPT到文生图,再到文生视频,那下一个又会是什么呢?

相关推荐
EdenMa2 小时前
从飞书 PRD 到代码实现:我的AI编程workflow
openai·ai编程
悟空码字7 小时前
当 AI 遇到真正的编程痛点,Codex 攻克 5 类核心难题总结
aigc·openai·ai编程
想要成为糕糕手7 小时前
从Python基础到LLM接口实战:在Notebook上实现AI自动生成亚马逊电商文案
python·openai
兆。8 小时前
Ollama_Moondream轻量级多模态模型实操教程
langchain·openai·moondream
呆呆敲代码的小Y9 小时前
【最新Codex教程】 | 安装、入门和快速使用,适合新手
人工智能·gpt·ai·llm·openai·agent·codex
Lei活在当下9 小时前
【AI手记系列】2026.6.1 一周AI小结(草稿)
llm·openai
机器之心1 天前
小学生画了撇胡子骗过AI年龄验证,硅谷工程师沉默了
人工智能·openai
机器之心1 天前
英伟达重新定义PC!史上最高效CPU来了
人工智能·openai
沸点小助手1 天前
「小时候的代码梦 & 大厂被裁程序员,到底裁的是谁?」获奖名单公示|本周互动话题上新🎊
openai·ai编程·沸点
nix.gnehc1 天前
深入理解 LLM Chat API 调用参数:从 OpenAI 标准到国内厂商实践
llm·openai