山姆·奥特曼传(二):OpenAI的第一次内斗

"物极必反,盛极必衰"。


一、斯是陋室,为吾德馨

正如第一章所讲到的,在硅谷的创业浪潮中,OpenAI 如一股清流般崛起,他们承诺 "自由合作",公开所有专利和研究成果。这在当时远超常规的 "改变世界" 口号,以其宏大的愿景和鲜明的利他主义色彩,甚至让一些员工将其比作现代版的曼哈顿计划。然而,与其说这是夸大其词,不如说是对他们使命的深刻理解和坚定信念。

虽然山姆和马斯克是公司的公众面孔,但在创立初期,他们并不常参与日常运营。真正推动公司前进的是两位鲜为人知的天才:格雷格・布罗克曼和伊尔亚·苏茨克维。

伊尔亚·苏茨克维被誉为 AI 领域的远见者。格雷格在回忆与伊利亚的初次相遇时,不吝溢美之词:"伊利亚・苏茨克维显然是世界上最适合这项工作的人。杰弗里・辛顿曾告诉我,引发计算机视觉深度学习革命的 AlexNet,是由亚历克斯・克里热夫斯基的 GPU 编程技能和伊利亚坚信深度神经网络必将在 ImageNet 上取得胜利的信念共同促成的。我们的想法相互增强和补充。伊利亚认为,顶尖研究人员会希望在一个致力于为世界创造最佳结果的 AI 组织工作,而我长期以来一直认为,将私营企业的资源与学术界的使命相结合是解决棘手问题的方法。如果不加干预,AI 的发展将会像自动驾驶汽车一样 ------ 在其潜力得到证实后,从最初的合作开始,演变为一场技术竞赛。但是,人类级别的 AI 将是一种与众不同的变革性技术,具有独特的风险和益处。在这里,我们看到了一个机会,可以保持该领域的合作性,并聚集许多最优秀的研究人员,负责任地尝试实现人类历史上最重要的技术突破"。

但要论到公司经营,格雷格・布罗克曼的贡献功不可没。关于这一点,山姆在博客中回忆道:"由于格雷格的贡献,OpenAI 才得以成立。他对事情快速而全情投入。我早期组织了一次团队晚餐,讨论这样一个组织可能会是什么样子,然后送他回家。在回旧金山的路上,格雷格在前半程问了我一些问题,然后宣布他加入了,并开始规划后续的事务。从那时起,他全身心地投入进来,对任何事情的电子邮件回复时间平均约为 5 分钟。埃隆和我都忙于日常工作,但格雷格在信息不完整和沟通成本很高的情况下(比如开会商讨一件事情要等很久才能沟通上),仍然保持着一切向前推进"。

正是这样一群秉持崇高理想的年轻人才让OpenAI这个小团队撑过了最初的岁月。因为,OpenAI初期的办公场地可以用简陋来形容------这个公司最初甚至没有正式的办公室,所有人都在格雷格的公寓里工作。大家基本上坐在沙发上、厨房柜台和床上,只要你能找到落脚的地方。 有一次伊利亚与另一位同事在讨论问题时想转身在白板上写点东西,却发现格雷格家里并没有办公用品。在得知这件事后,格雷格现去为两人搞来了白板和其它办公用品。

这看上去似乎有点疯狂,但这就是改变世界的初始之地。

二、摸不着头脑的工作

可能你会想:成立时那10亿美金呢?为什么不用它们置办场地? 现实是,直到 2019 年,那10亿美金才兑现了1.3亿。这个数字虽然看似可观,却远不及其他科技巨头的投入。而且不要谈这是持续兑现和持续支出了。当然,这在很大程度上也与OpenAI早期那些令人摸不着头脑的工作有莫大关系。

OpenAI的一些早期项目包括开发一个能清理桌子的机器人管家,制造一个可以单手拼好魔方的机械臂,以及创建能玩 Dota 2的 AI系统(即: OpenAI Five)。这些项目虽然在技术上令人印象深刻,但其实际应用价值和商业前景并不明确。

前 OpenAI 研究员彼得・阿贝尔(Peter Abel)这样回忆道:"我们研究了机器人技术、能在网上完成各种任务的智能体,甚至还研究了视频游戏。我们在做一些随机的事情,看看会发生什么。没有真正明确的目标。有时候感觉我们造出来的东西和我们想象的之间有很大差距。"

不过,这种看似散漫的研究方向反映了当时 AI 领域的一个普遍观点:为了最终创造出强大的 AI 系统,有时需要从看似微不足道的任务开始。OpenAI 的团队也坚信,今天在视频游戏和机器人上的研究,将为未来的自动驾驶汽车和能治愈癌症的 AI 铺平道路。

虽然在业务上东一榔头西一棒子,但值得肯定的是:OpenAI在2016年为人工智能研究领域带来了两个革命性的开源工具包:OpenAI Gym 和 Universe。这两个工具包的推出,犹如为 AI 研究者们打开了两扇通向未来的大门。

OpenAI Gym,顾名思义,就像是为 AI 设立的一个健身房。在这个虚拟的 "健身房" 里,研究者们可以让他们的 AI"运动员" 在各种环境中锻炼,从简单的平衡杆到复杂的机器人控制,再到雅达利出品的游戏。这个统一的训练场不仅为研究者们提供了丰富多样的实验环境,更重要的是,它建立了一个公平的竞技场。在这里,不同的 AI 算法可以在相同的条件下一较高下,就像运动员在奥运会上同场竞技一样。

而Universe 的推出则将 AI 的训练场景推向了一个全新的高度。如果说 OpenAI Gym 是一个专业的训练场,那么 Universe 就是一个模拟整个世界的虚拟宇宙。在这个 "宇宙" 中,AI 不再局限于特定的游戏或任务,而是可以像人类一样,在各种网站和应用程序中自由探索和学习。想一想,如果一个 AI 能够像你我一样,通过观察屏幕,操控虚拟的键盘和鼠标,在网上冲浪、玩游戏、甚至是学习新技能,那会是一件多么神奇的事。而这就是 Universe 所带来的革命性变化。

但....仅凭这些成绩真的能支持OpenAI的伟大使命吗?

三、出路

回顾 2015 年,AI 技术与今天相比还相对简单。那时的 AI 系统都是非常狭窄和专门化的,能下围棋的系统甚至不能下国际象棋,更不用说理解语言或引导行人过马路了。每次你需要开发一个新的应用,都必须训练一个全新的模型,这需要大量时间和标记数据。

而整个过程像是在黑暗中摸索前进:一个新模型被训练出来后,怎么看怎么都像在重复造旧轮子。鲜少有人知道如何造出别出心裁的轮子,更不要谈革命性突破了。

然而,2017 年,一篇名为《Attention is All You Need》的论文如同一道闪电,照亮了 AI 的未来道路。这篇由 Google Brain 团队撰写的论文介绍了 Transformer 架构,彻底改变了 AI 领域的格局。它能够处理未标记的、混乱的数据,并且比以前的方法更加高效。这是一个 "令人惊讶和痛苦的认识":最好的 AI 不是来自最专业的训练技术,而是来自拥有最多数据的人。

面对诞生的新架构,OpenAI的技术领袖------伊利亚迅速认识到了Transformer 的潜力。伊利亚坚信,AI 的下一个重大进展将不再仅仅依赖于算法的微调,而是来自于更大规模、更多样化的数据。这个洞察力为 OpenAI 后来的发展指明了方向。在他的推动下,OpenAI 迅速开始了基于 Transformer 架构的实验,特别是在自然语言处理领域。他们开发了 GPT(Generative Pre-trained Transformer)系列模型,这个系列后来成为了 OpenAI 最著名的成果之一。研究团队收集了海量的文本数据,涵盖了从科学论文到社交媒体帖子的各种内容。格雷格则形象地将这个过程比喻为 "给 AI 喂食整个互联网"。

在整个团队不断努力的情况下,OpenAI迎来了在技术上高速发展的"黄金三年",这段时期,公司在自然语言处理领域取得了突破性的进展,推出了令业界瞩目的 GPT-1、GPT-2 和 GPT-3 系列模型。每一次模型迭代都让模型复杂度成指数级别上升,与之成线性相关的------模型效果也一次次变得更好。

不过,这种一次次的技术飞跃,也让祸根一点点种下....

四、OpenAI 还是CloseAI?

在OpenAI高歌猛进时,山姆则经常强调 AI 可能带来的潜在灾难(尤其是在谈到OpenAI的工作时)。在接受 ABC 记者采访时,他表示:"我特别担心这些模型可能被用于大规模的虚假信息传播。我也担心随着这些系统在编写计算机代码方面变得越来越强大,它们可能被用于进行网络攻击。"与此同时,他还表达了对威权政府可能滥用 AI 技术的担忧。当被问及俄罗斯总统普京关于 "谁赢得 AI 竞赛,谁就能控制世界" 的言论时,他称之为 "令人不寒而栗的声明"。

然而,这种回答也引发了一些疑问:研发超级人工智能是否真的如同制造原子弹一样具有潜在的毁灭性影响?OpenAI 如何在追求技术突破的同时,确保其研究成果真正造福人类?这些问题不仅关乎 OpenAI 的未来,也涉及整个 AI 行业的发展方向和伦理考量。不过可以肯定的是,研究GPT一类的大型模型并不只有OpenAI一家公司,而很多人其实并不在乎那么多伦理道德的约束,在一定程度上,你可以视其为一种"有自毁倾向"的尝试。

随着 OpenAI 的模型变得越来越强大,山姆和其它高层开始重新考虑其最初的开放性承诺。当他们在 2019 年发布 GPT-2 模型时,出于对潜在滥用的担忧,他们最初决定不完全公开分享该模型。彼得·阿贝尔回忆道:"很明显,它对语言的理解比以前训练过的任何东西都要好得多。它的发布确实伴随着很多营销或谨慎,或者两者兼而有之。"

这种转变引发了这一系列变化也引发了人们对OpenAI 诚信的质疑。公司成立时,山姆曾告诉记者,OpenAI 将是开源的,每个人都可以使用。然而,随着时间的推移,这个承诺逐渐模糊。在一次 2023 年的演讲中,他询问观众是否希望 OpenAI 开源其最新模型,然后立即否定了这一可能性:"我很好奇我们是否会保持 GPT-5 和 GPT-6 的轨迹像 GPT-2 到 GPT-4 那样。你们中有多少人希望我们在训练结束六天后就开源 GPT?嗯,我们不会这样做,但这是一个有趣的数据(指观众们的反应)。"

这番言论显得相当傲慢。山姆明知 OpenAI 最初是建立在开源承诺之上,却在向观众询问开源模式后立即否定了这一可能性。多年来,他逐渐改变了 "开放" 的含义,使之变得更加模糊。更有趣的是, 早在2016年时,一封内部邮件揭示了 OpenAI 早期对 "开放" 概念的讨论。伊利亚在邮件中写道:"随着我们越来越接近打造人工智能,开始变得不那么开放是有道理的。OpenAI 中的 "Open" 意味着每个人都应该从人工智能建成后的成果中受益,但完全可以不分享科学研究成果(尽管在短期内,甚至可能是中期内,分享一切都是为了招聘目的而采取的正确策略)"

这封邮件表明,OpenAI 从一开始就计划不完全公开分享他们的科学成果。他们想保持开放的公众形象,因为这给了他们招聘优势,但实际上并不打算像他们声称的那样完全开源。

对此,OpenAI 董事会成员里德・霍夫曼(Reid Hoffman)辩护说:"我们的使命保持不变,但我们的策略必须改变。有些人担心这会破坏我们的最初使命。但是,你知道,如果仅仅是因为这个举动就认为公司等于坏或腐败,那就太天真了。因为公司与其它组织和社会机构合作的方式有很多。"

话虽这么说,但对于在学术研究上,OpenAI逐渐变为CloseAI这一事实,到了今天应该是广为人知的事情了。不过,让OpenAI越来越"背离初心"还有另外一剂猛药。

五、釜底抽薪

让我们把目光移回到OpenAI成立之初。

早在2015年筹建OpenAI时,马斯克就曾向山姆和格雷格承诺过兜底的事情:他承诺如果别人不能如期兑现一共10亿美金的总资本,马斯克则将会补齐剩下的。

但当时OpenAI的体量和业务还远远用不上------或者说没有那么大吸引力筹集得上那10亿美金。不过到了2017 年初(也就是OpenAI开始使用Transformer构建第一代模型时),山姆、格雷格等人意识到构建 AGI将需要大量计算资源,因此需要每年数十亿美元,而这些钱远远超过了在马斯克在内所有高层------认为OpenAI作为一个非营利性组织能够筹集到的钱。

正因为如此,在同年年底,山姆和马斯克决定下一步的任务是创建一个营利性实体,以支撑住他们的宏大梦想,然后他们开始了新一轮的磋商谈判。在谈判中间马斯克告诉山姆和其它高层,他不认为OpenAI现在是个能和Google抗衡的竞争对手,但特斯拉是,他希望让OpenAI与特斯拉合并。策略很简单------让特斯拉作为"摇钱树"(就好像早期的SpeaceX那样,虽然它与NASA有着密切的商业合作)给OpenAI输血,再加上OpenAI的研发人才,虽然没有百分百的把握能和Google抗衡,但也总比OpenAI现在这0%强的多。

但,这样做的直接影响就是:马斯克会直接控制OpenAI。如果说格雷格和伊利亚尚能在日常经营中忍受马斯克的鲁莽和冲动(毕竟彼时马斯克是OpenAI主要金主),但这个夺权的举动很明显激起了所有人的不满和反对,而邮件中据理力争的口水仗一直打到了18年年底。

在有史可考的最后一封邮件中,马斯克说到:"即使筹集数亿也不够,而是需要每年数十亿美元,否则就算了。"

对于此,马斯克传记的作者阿什利・凡斯(Ashley Vance)解释道:"就像所有事情一样,随着时间的推移,埃隆想要拥有越来越多的控制权,并确保公司按照他想要的方式运作。埃隆在任何事情上的首选角色都是 CEO、主导力量和控制日常事务的人。"

城门失火,殃及池鱼。在整个争论过程中,马斯克直接扣下了公司的运营资金,让OpenAI身陷囹圄,最困难时连员工的薪水都成了问题。这么做很符合马斯克在内部斗争中的经验和原则,正如阿什利所说:"埃隆的反应通常是不惜一切代价试图获胜。他很少输掉战斗。如果不是在公司内部,他通常会起诉某人屈服。如果是在公司内部,他会在公司政治上四处施加影响力,直到得到他想要的。"

也就是在这个最困难的时刻,里德・霍夫曼自掏腰包弥补上了这个缺口,才得以让公司得以维持下去。也正是在这时,公司高层们一致推举山姆作为带领OpenAI前进的掌舵人。面对自己在夺权上的失利,马斯克在发完最后一封邮件的不久后就愤怒地带着他的钱和他挖到的人离开了OpenAI。

可面对这样一个烂摊子,山姆·奥特曼又该如何力挽狂澜?

他们的理想和OpenAI的使命又该如何维持下去?

让我们下一章再讲。

我是蓝衣剑客,谢谢你看我的文章。

资料来源:

  1. Greg Brockman blog ( blog.gregbrockman.com/)
  2. www.britannica.com/money/OpenA...
  3. Open AI Wiki(en.wikipedia.org/wiki/OpenAI)
  4. openai.com/index/intro...
  5. www.internetsearchinc.com/ultimate-gu...
  6. Lex对话山姆2.8万字实录:是马斯克选择分道扬镳 想掌控OpenAI(news.qq.com/rain/a/2024...)
  7. OpenAI and Elon Musk(openai.com/index/opena...
相关推荐
范文杰9 分钟前
AI 时代如何更高效开发前端组件?21st.dev 给了一种答案
前端·ai编程
阿坡RPA3 小时前
手搓MCP客户端&服务端:从零到实战极速了解MCP是什么?
人工智能·aigc
用户27784491049933 小时前
借助DeepSeek智能生成测试用例:从提示词到Excel表格的全流程实践
人工智能·python
机器之心4 小时前
刚刚,DeepSeek公布推理时Scaling新论文,R2要来了?
人工智能
算AI6 小时前
人工智能+牙科:临床应用中的几个问题
人工智能·算法
凯子坚持 c6 小时前
基于飞桨框架3.0本地DeepSeek-R1蒸馏版部署实战
人工智能·paddlepaddle
你觉得2057 小时前
哈尔滨工业大学DeepSeek公开课:探索大模型原理、技术与应用从GPT到DeepSeek|附视频与讲义下载方法
大数据·人工智能·python·gpt·学习·机器学习·aigc
8K超高清7 小时前
中国8K摄像机:科技赋能文化传承新图景
大数据·人工智能·科技·物联网·智能硬件
hyshhhh7 小时前
【算法岗面试题】深度学习中如何防止过拟合?
网络·人工智能·深度学习·神经网络·算法·计算机视觉
薛定谔的猫-菜鸟程序员7 小时前
零基础玩转深度神经网络大模型:从Hello World到AI炼金术-详解版(含:Conda 全面使用指南)
人工智能·神经网络·dnn