杨立昆退休?中国Deepseek超Llama 4触发Meta

昨天,人工智能领域发生了一些事情:杨立昆领导的Meta 生成式人工智能部门(Meta genai org)陷入了恐慌模式。 杨立昆是 Meta(原 Facebook)的首席人工智能科学家,同时也是纽约大学的教授。杨立昆因其在深度学习领域的开创性工作而获得了图灵奖(Turing Award),这是计算机科学领域的最高荣誉之一。 恐慌模式始于 [Deepseek V3](https://www.jdon.com/77117.html),它在性能测试中已经超过了 [Llama 4](https://www.jdon.com/73366.html)。更让人尴尬的是,这是一家"不知名的中国公司,只用了 [550 万美元](https://www.jdon.com/76794.html)的训练预算"。 工程师们正在疯狂地研究 Deepseek,试图从中复制一切可能的东西。我一点都没有夸张。 管理层在担心如何证明生成式人工智能组织的高额成本是合理的。当每个生成式人工智能组织的"领导"的薪水都比训练整个 Deepseek V3 的成本还要高时,他们该如何面对高层领导呢?而且我们有很多这样的"领导"。 Deepseek r1 让事情变得更可怕了。我不能透露机密信息,但这些信息很快就会公开。 这个组织本应该是一个专注于工程的小团队,但因为很多人想加入并争夺影响力,导致招聘人数被人为地扩大了,结果大家都输了。 [Yann LeCun 杨立昆](https://www.jdon.com/73864.html)很快就要退休了!他认为[大语言模型不会通向AGI](https://www.jdon.com/75634.html),他大概太想做出比 [Transformer(](https://www.jdon.com/74305.html)大语言模型背后的架构核心)更好的东西了,结果反而没把 Transformer 的**真正潜力完全** 发挥出来。这可能是他这辈子犯的最大的错误。([灯下黑](https://www.jdon.com/58928.html)) **网友1:** 这些投资了几十亿美元的大公司,随便哪一家都有可能在这项技术上做到最厉害。只要有一个在最前面的人悄悄放手,或者愿意分享一点点,整个领域就能重新变得强大起来。 科学家们之间的共同点比那些亿万富翁多得多。而且,那些最懂自己研究的人,也越来越明白这一点了。 **网友2:** 确实[没有护城河](https://www.jdon.com/77137.html)。限制因素将是硬件,直到算法效率使硬件变得无关紧要,或者一些聪明的人效仿 torrents 或 seti@home 的脚步制造出分布式人工智能。 目前唯一一家拥有护城河的公司是 NVDA(也许还有拥有 TPU 的 GOOG) **网友3:** Google 的人说:昨天,DeepSeek 做的事情真的很疯狂。 不仅仅是 Meta,他们也在给 OpenAI、Google 和 Anthropic 施加压力。 这是件好事,因为我们正在看到真正的开放竞争对创新有多有效。 Google 的Full 2 思维模型会比 4 月或 5 月推出的 r2 模型更厉害! 最主要的问题是,Full 2 的价格比竞争对手便宜了 30 倍。这就是为什么 OpenAI 会让 o3 或者至少 o3 mini 免费使用。这对他们来说可能会变成一个烧钱的陷阱。 **网友4:** 如果你还没试过 DeepSeek R1,我强烈建议你去试试。通过观察这个模型是怎么思考的、怎么反复自我反馈,还有怎么像人类一样测试新方法,你会意识到我们离真正的[通用人工智能(AGI)](https://www.jdon.com/74116.html)比你想象的要近得多。 这真的太神奇了,我感觉自己像是在和其他智慧生物一起生活在地球上,因为我真的能看到这个模型是怎么一步步想出最终答案的。 **网友5:** 为什么 Meta 会恐慌,他们甚至没有试图从中赚钱。只有 OpenAI 才应该恐慌! **网友6:** "没有护城河"最有趣的地方是,[芯片制造商](https://www.jdon.com/76884.html)会成为大赢家。谷歌至少可以转向用他们的 TPU 来开发其他型号,或者专门为自己的平台(比如 Android)开发人工智能。Meta 怎么办?他们的人工智能已经完全开源了,现在他们只是在"烧钱"。 **网友7:** 跟 Deepseek R1 比起来,[Gemini](https://www.jdon.com/72206.html)的快速思维模型真的差太多了,我一点都没夸张。在我非常重要的工作中,我们经常开玩笑说 Gemini 比 Deepseek 差远了,因为 Gemini 需要试 5-6 次才能做到 Deepseek 一次就能搞定的事情。差距真的太大了。 **网友8:** 过去几个月,我几乎每天都使用 o1 工作。我可以自信地说,在我使用它完成的任务中,R1 与 o1 非常接近,接近到我取消了 chatgpt 订阅。我同意大多数基准测试的结果,o1 仍然略胜一筹,更稳定,但 R1 紧随其后。天哪,它是免费的!

相关推荐
知识分享小能手7 分钟前
JavaScript学习教程,从入门到精通,Ajax与Node.js Web服务器开发全面指南(24)
开发语言·前端·javascript·学习·ajax·node.js·html5
Danta1 小时前
百度网盘一面值得look:我有点难受🤧🤧
前端·javascript·面试
海上彼尚3 小时前
使用Autocannon.js进行HTTP压测
开发语言·javascript·http
layman05283 小时前
node.js 实战——(fs模块 知识点学习)
javascript·node.js
毕小宝3 小时前
编写一个网页版的音频播放器,AI 加持,So easy!
前端·javascript
万水千山走遍TML3 小时前
JavaScript性能优化
开发语言·前端·javascript·性能优化·js·js性能
Aphasia3113 小时前
react必备JS知识点(一)——判断this指向👆🏻
前端·javascript·react.js
会飞的鱼先生4 小时前
vue3中slot(插槽)的详细使用
前端·javascript·vue.js
知心宝贝4 小时前
🔍 从简单到复杂:JavaScript 事件处理的全方位解读
前端·javascript·面试
cg50174 小时前
Vue 的数据代理机制
前端·javascript·vue.js