65 岁图灵巨头离职创业!LeCun 愤然与小扎决裂,Meta 巨震

「【新智元导读】AI 圈爆出大瓜!65 岁图灵巨头 LeCun 即将离职 Meta,与小扎正式决裂。接下来,他将投身「世界模型」开启创业下半场。」

图灵巨头 LeCun 真的要跑路了!

刚刚,FT 独家爆料,现任 Meta 首席 AI 科学家 LeCun,决定将在未来几个月离职。

下一步,开启人生创业的第二阶段。

消息一出,瞬间引爆全网。此前,坊间传闻称,LeCun 因不满内部架构调整想要离职。

如今,65 岁的图灵巨头,终于做出了这个决定。

扩展阅读:

LeCun 考虑辞职!Meta AI 百亿豪赌引爆「内战」,逼走首席科学家

LeCun 怒揭机器人最大骗局,坦白 Llama 与我无瓜!

据称,LeCun 将要成立的新公司主要推进「世界模型」,目标直指真正的人类级智能。

目前,他正在进行早期的融资洽谈。

网友盲猜,LeCun 离职可能和会见吴恩达有所关联

任职 12 年,从创办 FAIR 实验室,到拿下图灵奖,再到笃定的世界模型,LeCun 出走对于 Meta 来说,是一次巨震。

或许,小扎的超级智能梦,真的要碎了。

有网友表示,这并不意外。另有人调侃道,「要始终向一个孩子汇报工作,LeCun 的自尊心怎么不会受到伤害呢」。

上下滑动查看

「效力 12 年决裂,LeCun 愤然离职」

不得不说,这事儿来的太突然,但却早有苗头。

当前,正值 Meta 对公司 AI 业务进行大刀阔斧的改革之际,希望开发出更强大的 AI,挑战 OpenAI、谷歌等竞争对手。

今年初,Llama 4 发布翻车,且性能远不及 ChatGPT、Gemini 等模型。而且,Meta AI 聊天机器人推出后,许多人并不买账。

在认定 Meta 在竞争中落后之后,小扎的战略重心也随之改变------

从 LeCun 领军的 FAIR 实验室,转向更快推出模型和 AI 产品。

先是今年 4 月,小扎斥资 143 亿美元聘请了 28 岁 Alexandr Wang,去领导全新「超级智能」团队。

在此过程中,他亲自组建 TBD Lab,开出高达 1 亿美元的薪酬包,从谷歌、OpenAI 抢人。

其中包括,ChatGPT 的核心研究员 Shengjia Zhao,被挖来出任 MSL 首席科学家。

目标很简单,推动其下一代大语言模型的开发。

仅在今年,Meta 内部就进行了超 4 次架构调整和优化,并将 MSL 分立出四大部门,全部由 Alexandr Wang 掌舵:

  1. TBD Lab (To Be Determined,待确定,负责探索 / 先导研究)
  2. FAIR (Fundamental AI Research,长期前沿研究)
  3. 产品和应用团队 (含 Meta AI 助手等)
  4. 基础设施 (训练与推理的算力、数据与平台)

因此,此前向首席产品官 Chris Cox 汇报的 LeCun,现在转而向 Wang 汇报。

不仅如此,LeCun 长期领导的 FAIR 也逐渐被边缘化,向比他小 30 多岁的 Wang 汇报,包括论文,也需得到审批后才可发表。

另一方面,LeCun 认为小扎置于其战略核心的 LLM 虽然「有用」,但永远无法像人类一样进行推理和规划。

在 FAIR 内部,LeCun 也一直专注于开发「世界模型」,但在短期内,是看不到 KPI 的。

而小扎现在要的是,立即就能变现的 AI 产品。

看得出,LeCun 所坚持的路线和个人观点,与 Meta 的 AI 愿景出现了明显的分歧。

种种因素的叠加,早已成为 LeCun 离职的导火索。而现在,就是最好的时机。

「全力押注「世界模型」」

庆幸的是,LeCun 终于可以在「世界模型」上大展身手了。

一直以来,他坚信大模型最终没有出路,永远学不会真正的推理和规划,也根本无法通往 AGI。

LLM 不如阿猫阿狗,LeCun 已在多种公开场合中多次提出。

在他看来,AI 的终局就是「世界模型」。

前段时间,他在 MIT 访谈中直言,未来 3-5 年内,「世界模型」会成为 AI 架构的主流模型。

这话可让我在硅谷得罪了不少人,包括某些巨头公司。

到那时候,但凡头脑清醒的人,都不会再用现在这种生成式 LLM 的路子了。

世界模型不仅仅学习语言,还通过视频和空间数据,来理解物理世界。

直白讲,它让 AI 可以像婴儿一样,从观察中学习世界的规律。

不过,LeCun 表示,开发出这个架构需要十年的时间才能成熟。

即便时间漫长,他终于可以坚定按着目标方向前进了。

未来几个月,LeCun 将正式离职 Meta,下一步计划将专注于深化在「世界模型」领域的研究。

AI 掌舵人出走,这意味着,FAIR 实验室就彻底被边缘化了。

「图灵巨头,开启 AI 革命」

1960 年 7 月 8 日出生的 Yann LeCun,在法国巴黎的郊区长大。

他的姓氏原本是 Le Cun,但他发现美国人常对此感到困惑,将 Le 误作他的中间名,于是便去掉了中间的空格。

他的父亲是一名工程师,在 LeCun 充满修补创造的童年中,将自己对电子和机械的热爱传给了他。

青少年时期,LeCun 既喜欢在乐队中演奏,也热爱科学与工程。

后来,他在法国精英工程师学校之一的巴黎高等电子与电工工程师学院(ESIEE Paris)获得了相当于硕士的学位。在那里,他专注于微芯片设计与自动化。

他从本科时代就开始独立进行机器学习研究,并将其作为他在索邦大学(当时称为皮埃尔和玛丽 · 居里大学)博士阶段的核心工作。

LeCun 的研究与 Geoffrey Hinton 独立做出的发现高度相似。

  • 与 Hinton 一样,他被当时尚属非主流的神经网络人工智能方法所吸引;
  • 也与 Hinton 一样,他发现可以通过使用后来被称为「反向传播」的算法来有效训练输入和输出节点之间中间层的「隐藏」神经元,从而克服简单神经网络众所周知的局限性。

1985 年在法国阿尔卑斯山区举办的一场研讨会,首次让 LeCun 与从事相关研究的国际学术界有了直接接触。

正是在那里,他结识了 Hinton 的密切合作者 Terry Sejnowski。当时,Sejnowski 关于反向传播的研究尚未发表。

几个月后,Hinton 到访巴黎,并主动向 LeCun 作了自我介绍。

再之后,LeCun 则受邀参加卡内基梅隆大学的夏季研讨会,并在多伦多 Hinton 新成立的研究小组进行了一年的博士后研究。

1988 年,博士后研究结束时,LeCun 加入了著名的计算机科学研究中心------贝尔实验室。

在贝尔实验室,LeCun 的工作专注于神经网络架构和学习算法。

他影响最为深远的贡献是一种名为「卷积神经网络」的新方法。这是他早期成就的延伸,因为卷积网络依赖反向传播技术来训练其隐藏层。

除了开发卷积方法,LeCun 还率先将其应用于「图 Transformer 网络」,用于识别印刷体和手写文本。这项技术被用于一个广泛部署的系统,以读取支票上的手写数字。

他在贝尔实验室的另一项主要贡献是开发了「最佳脑损伤」(Optimal Brain Damage)正则化方法。

这个名字生动的概念旨在通过移除神经网络中不必要的连接来简化网络。如果操作得当,这种「脑损伤」可以产生更简单、更快速的网络,其性能与完整版本相当甚至更优。

1996 年,在计算机行业未能立足的 AT&T 公司,将贝尔实验室的大部分业务及其电信硬件业务分拆成立了一家新公司------朗讯科技。

LeCun 留在了 AT&T,负责一个专注于图像处理研究的实验室小组。

在那里,他的主要成就是 DjVu 图像压缩技术。

2003 年,LeCun 离开工业界,前往纽约大学库朗数学科学研究所担任计算机科学教授。

在纽约大学,LeCun 负责计算与生物学习实验室,继续他在机器学习算法和计算机视觉应用方面的工作。

他至今仍在纽约大学任教,尽管随着声誉日隆,他又增添了几个新头衔和额外职位。

到 2010 年代初,各大科技公司竞相部署基于神经网络的机器学习系统。与其他顶尖研究人员一样,LeCun 也受到了科技巨头的青睐。

2013 年 12 月,他加入 Facebook 并创建了 FAIR(Facebook AI Research),同时,他也还兼顾在纽约大学的工作。

2018 年,他卸任主任一职,转任 Facebook 首席人工智能科学家,专注于战略规划和科学领导力。

同年,他与 Geoffrey Hinton 和 Yoshua Bengio,共同获得了图灵奖。

时至今日,LeCun 一直保持着对动手创造的热爱,他的爱好包括制造飞机、电子乐器和机器人。

或许,这也是他在 65 岁时,毅然决定下海创业的动力之一。

参考资料:

www.ft.com/content/c58...

相关推荐
机器之心2 小时前
全球第二、国内第一!钉钉发布DeepResearch多智能体框架,已在真实企业部署
人工智能·openai
新智元2 小时前
翻译界的 ChatGPT 时刻!Meta 发布新模型,几段示例学会冷门新语言
人工智能·openai
沉默媛2 小时前
什么是Hinge损失函数
人工智能·损失函数
北青网快讯2 小时前
声网AI技术赋能,智能客服告别机械式应答
人工智能
机器之心2 小时前
TypeScript超越Python成GitHub上使用最广语言,AI是主要驱动力
人工智能·openai
nju_spy2 小时前
周志华《机器学习导论》第 15 章 规则学习(符号主义学习)
人工智能·机器学习·数理逻辑·序贯覆盖·规则学习·ripper·一阶规则学习
许泽宇的技术分享3 小时前
当 AI 工作流需要“人类智慧“:深度解析 Microsoft Agent Framework 的人工接入机制
人工智能·microsoft
antonytyler3 小时前
机器学习实践项目(二)- 房价预测增强篇 - 特征工程四
人工智能·python·机器学习
飞哥数智坊3 小时前
TRAE SOLO 正式版上线,限时免费活动开启
人工智能·trae·solo