DeepSeek效应初现:Grok-3补刀ChatGPT,OpenAI已在ICU?

嘿,技术小伙伴们!今天咱们聊聊最近在AI界引发轰动的新闻------DeepSeek和xAI相继用R1和Grok-3证明了预训练Scaling Law并非OpenAI的护城河。这意味着什么呢?让我们一探究竟!

开场白

首先,让我们看看最新的"全能冠军"------Grok 3。这款被誉为"地球上最聪明的AI"的模型不仅证明了Scaling Law的有效性,还进一步攻破了OpenAI的技术壁垒。😱

深度探讨:Scaling Law vs. 推理能力

在此之前,DeepSeek已经证明无需依赖Scaling Law也能达到OpenAI o1的水平。这就像是"一根筋,两头堵",无论Scaling Law是否有效,OpenAI的技术优势似乎都在逐渐消失。

经济学家Ethan Mollick认为:AI确实进入了新时代,OpenAI的时代正在落幕。这不禁让人质疑,OpenAI的未来还能否持续领先?

数据的重要性

一个关键点是,谷歌和xAI拥有独特且有价值的数据源,这些数据源使它们逐渐区别于其他竞争对手。如果没有访问YouTube、X、TeslaVision、Instagram和Facebook等独有数据,未来的尖端模型可能不会有投资回报(ROI)。

OpenAI面临的挑战

从2022年夏季到2024年春季,OpenAI凭借GPT-4领先市场,但随着谷歌和Anthropic的追赶,这种领先地位已不再明显。如今,DeepSeek、谷歌和xAI与OpenAI大致处于同一水平,其中xAI甚至稍占优势。

微软CEO纳德拉也公开表示,在模型能力上,OpenAI曾经拥有的独特优势即将结束。而微软也不再为OpenAI投入大量资金进行预训练,转而支持推理服务以盈利。

内忧外患:人才流失与外部压力

除了外部的竞争压力,OpenAI内部也面临着巨大的挑战。前CTO Mira Murati、首席科学家Ilya Sutskever、创始员工Andrej Karpathy以及副总裁Dario Amodei等重要人物纷纷离职,创立了自己的公司或实验室。这对OpenAI来说无疑是个沉重的打击。😢

AI的收入来源:推理而非训练

有趣的是,AI的收入主要来自推理,而非训练。如果Scaling Law仍然有效,那么只有少数几家公司会进行尖端模型的预训练。其余的AI计算将集中在一些较小的数据中心,这些数据中心经过地理优化,实现了低延迟和高成本效益的推理。

Gavin S. Baker指出:"经济高效的推理 = 更便宜、质量较低的电力"。随着时间的推移,推理所需的计算量将大大增加,而预训练的比例将减少至5%,推理则占95%。

DeepSeek效应:开源与创新

即便是DeepSeek梁文峰也公开表示,业内对DeepSeek-R1的反应有些过度。他认为这只是普通的创新,世界每天都有类似的进展。然而,DeepSeek的确在大模型训练上取得了一些创新,并且与其他从业人员一样研究同样的问题。

更令人兴奋的是,他们在开源AI界引发了用最经济的方法复刻DeepSeek-R1"顿悟时刻"的竞赛。这一切就像是2004年的谷歌,通过分布式算法和开源论文推动了整个行业的发展。

结语

总的来说,这场AI界的较量远未结束。尽管OpenAI面临诸多挑战,但AI领域每周都会有新的突破和发展。每个人都会在几个月内复制这一成就,一切都会变得更便宜。

唯一的真正后果是,AI乌托邦/末日现在比以往任何时候都要近。时间会证明一切,让我们拭目以待吧!

如果你对这篇文章感兴趣,或者有不同的见解,欢迎在评论区留言分享你的想法哦!😊

相关推荐
没事学点编程小知识25 分钟前
Notion的AI布局:Notion Mail即将上线
人工智能·notion
zhz521431 分钟前
深入剖析Notion:在众多知识库软件中的独特优势与局限
人工智能·ai·知识图谱·ai写作·程序员创富
胖头鱼不吃鱼-33 分钟前
AI与.NET技术实操系列
人工智能·.net
MF_AI35 分钟前
颈椎X光数据集(cervical spine X-ray dataset)
图像处理·人工智能·深度学习·yolo·计算机视觉·spine
叶子20242243 分钟前
点云滤波方法:特点、作用及使用场景
人工智能·计算机视觉
☞黑心萝卜三条杠☜1 小时前
CrossKD: Cross-Head Knowledge Distillation for Object Detection
人工智能·目标检测·目标跟踪
CS创新实验室1 小时前
《机器学习数学基础》补充资料:连续正态分布随机变量的熵
人工智能·机器学习·概率论·机器学习数学基础
tzc_fly1 小时前
scBaseCamp:一个AI代理的可持续扩充的单细胞数据存储库
人工智能
江苏学蠡信息科技有限公司2 小时前
基于RKNN的嵌入式深度学习开发(2)
人工智能·深度学习
量子-Alex2 小时前
【多模态目标检测】M2FNet:基于可见光与热红外图像的多模态融合目标检测网络
人工智能·目标检测·计算机视觉