图灵奖大佬向 97 年小孩哥汇报?小扎 1 亿年薪买新贵,老将痛诉熬夜捡 GPU!

「【新智元导读】图灵奖大佬向 97 年小孩哥汇报,这是什么魔幻剧情?小扎砸 143 亿请来的「数据标注少年」,已荣升 Meta 首席 AI 官。一边是小扎上亿美元年薪 offer 引进新员工,另一边是 Meta 老将 GPU 告急不得不熬夜借卡差点头秃。网友们痛呼:太为 Meta FAIR 的员工难过了......」

起猛了,看到 LeCun 给 Alexandr Wang 汇报了!

一个是图灵三巨头、多年学术泰斗,一个是靠着数据标注成功晋身亿万富翁的 97 年小孩哥,这个画面,实在是过于魔幻了。

为了 Wang,小扎砸下了足足 143 亿美元,拿下整个 Scale AI 49% 股权。可以说,是真正的「为了一个人,买下一个公司」。

现在,Scale AI 前 CEO Alexandr Wang 已经飞上枝头变凤凰,摇身一变成为 Meta 的「首席 AI 官」,并将领导 Meta 的全新梦之队「超级智能实验室」。

小扎砸了上亿挖来的 OpenAI 精兵强将,都将向他汇报。

甚至...... 包括 LeCun?

想到这个可能性,每个人都倒抽一口凉气。

就在昨天,Alexandr Wang 正式发布 X,表示自己非常激动能成为 Meta 的首席 AI 官,同时转发了那份华丽丽的 11 人名单。

HuggingFace 联创兼 CEO Clement 立刻祝贺道:由于 Wang 和 Nat Friedman 的加入,Meta 在 AI 领域的影响力还将提高 100 倍。

而 LeCun,也非常「识时务」地转发了这条 X。

是「人在屋檐下,不得不低头」的礼节性逢场作戏,还是真心相信?抑或,这是一种「你品,你仔细品」的讽刺?

LeCun 内心深处的真实想法,我们不得而知。

至少,在昨天的风口浪尖之上,他发了这样一条耐人寻味的 X:「是首席人工智能科学家,从 2018 年至今一直都是」。

「Meta 老员工暗示」

「小扎偏心过头了」

总之,最近小扎的种种操作,一方面让不少研究者眨眼间实现了暴富神话,一方面也让不少兢兢业业的 Meta 老员工伤透了心。

FAIR 实验室的研究者 Zeyuan Zhu 表示,因为受限于 GPU 访问权限,自己的研究进度比较缓慢,虽然已经取得了非常亮眼的成果。

Zhu 表示,这是 LLM 设计的伽利略时刻。

正如比萨斜塔实验引发了现代物理学,他们在可控的合成预训练环境中,揭示了 LLM 架构的真正局限。

而这,很可能会成为将 LLM 研究的一个重大分水岭。

具体来说,在现实世界中的预训练(规模达千亿 tokens)中,常常因为数据噪声太大,掩盖了模型架构之间的差异。

但在他构建的可控合成数据环境中,推理的深度提升了 2 倍,高级能力发生了早期涌现,甚至高质量数据可以预测未来模型的设计路径。

为此,他设计了 5 个合成预训练的任务,确保能让 LLM 实现真正的思维推理(也即系统 1),而非仅仅是 CoT 思维链。

为此,研究者提出了 Canon 层,这是一种轻量级的横向残差结构。它可无缝接入任何模型,却让推理能力显著提升(推理深度提高 2-4 倍,广度增加 30%),而且开销极小,具有颠覆性的效果。

为了完成这项研究,Zhu 熬夜了一整月,进行了 190 万 GPU 小时的实验,一度精疲力竭。

Zhu 是清华基科班的本科生,随后在 MIT、普林斯顿求学,后成为 Meta FAIR Lab 的研究者。

这项研究也引起了 X 上不少研究者的关注,但因为 GPU 资源受限无法快速推进,实在可惜。

Zhu 甚至透露说,为了将实验进行到底,自己不得不在其他团队的集群中寻找闲置的 GPU,甚至不断更换 GPU,而且为了不耽误其他团队的进度,自己的使用时间只能在夜晚和周末。

这件事被 Reddit 网友们发现后,他们纷纷表示太为 FAIR 的老员工难过了。

据说 FAIR 实验室有 30 万块 GPU,究竟都分给谁了呢?

「冰火两重天!」

「一边上亿年薪,一边立刻裁员」

最近,小扎为了挖走自己的心仪员工,开价也是十分离谱。

据说,最顶尖的研究者,拿到了四年 3 亿美元的薪酬包,光第一年的总薪酬就超过 1 亿。

奥特曼甚至直言,他们「已经从角落里的一群书呆子,变成了至少是科技行业最受瞩目的人物」。

不少研究者,转眼就获得了 NBA 球星一般的待遇。

然而,Meta 的一位高级工程师表示,自己在 Meta 的年薪却仅为 85 万美元。

根据 Levels.FYI 统计的数据,薪酬等级高于这位工程师的人(E7 级别)平均年薪为 154 万美元

与此同时,另外一些大科技公司的员工,待遇却可谓是冰火两重天。

Hyperbolic 联创 Yuchen Jin 表示,自己在旧金山一家披萨店吃晚餐时,无意中听到一位大科技公司的工程师说自己刚刚被解雇了。

就在五分钟后,邻桌的一个人拍了拍他的肩膀,表示自己也有同样的经历,而且「我的经理说是 AI 抢了我的工作」。

一方面,Meta 这类公司为某些员工提供着高达上亿美元的薪酬,另一方面,曾经的金字招牌 CS 专业,如今却在全美大学中失业率最高的专业中排名第七。

这,就是如今科技圈的怪现状。

因为实在太魔幻,甚至很多人在质疑这件事的真实性

引用某位网友的话说就是,「对平庸的惩罚从未如此严重,但对卓越的回报也从未如此之高」。

可以说,如今的 AI 圈,已经有了职业体育的趋势。比如网球能打进全球排名前 100,就能过上十分体面的生活,但绝大多数人却还在为生计发愁,甚至只能去当网球教练。

而且就在今天,微软又曝出了新一轮裁员潮,将有 9000 人被裁,影响全球近 4% 的员工,至此,微软今年将总共有 18000 人被裁。

总之,这个职业会继续遵循帕累托法则。

能真正创造商业价值的顶级开发者,薪酬还会越来越高。但差异性极小的劳动者,很可能就会被 AI 优化和替代。

总之,旧金山的大科技公司,永远不会承认自己过度招聘了。如果真的去仔细调研,可能会发现这些高薪招来的人,干的却是很容易被替代、无关紧要的岗位。

不过,对于已经入了 CS 门的学生,不去搞 AI,前途在哪里呢?

莫非,真的如 AI 教父 Hinton 所说,去干水管工?

参考资料:

x.com/ZeyuanAllen...

x.com/michael_kov...

相关推荐
葫三生40 分钟前
如何评价《论三生原理》在科技界的地位?
人工智能·算法·机器学习·数学建模·量子计算
m0_751336392 小时前
突破性进展:超短等离子体脉冲实现单电子量子干涉,为飞行量子比特奠定基础
人工智能·深度学习·量子计算·材料科学·光子器件·光子学·无线电电子
美狐美颜sdk5 小时前
跨平台直播美颜SDK集成实录:Android/iOS如何适配贴纸功能
android·人工智能·ios·架构·音视频·美颜sdk·第三方美颜sdk
DeepSeek-大模型系统教程5 小时前
推荐 7 个本周 yyds 的 GitHub 项目。
人工智能·ai·语言模型·大模型·github·ai大模型·大模型学习
郭庆汝5 小时前
pytorch、torchvision与python版本对应关系
人工智能·pytorch·python
小雷FansUnion7 小时前
深入理解MCP架构:智能服务编排、上下文管理与动态路由实战
人工智能·架构·大模型·mcp
资讯分享周7 小时前
扣子空间PPT生产力升级:AI智能生成与多模态创作新时代
人工智能·powerpoint
叶子爱分享8 小时前
计算机视觉与图像处理的关系
图像处理·人工智能·计算机视觉
鱼摆摆拜拜8 小时前
第 3 章:神经网络如何学习
人工智能·神经网络·学习
一只鹿鹿鹿8 小时前
信息化项目验收,软件工程评审和检查表单
大数据·人工智能·后端·智慧城市·软件工程