顶级AI评论员:算力狂飙撞墙后,AI的下一场革命靠什么?| 不摸鱼的独立开发者日报(第43期)

✍️ 说明

日报相关信息:

网站:daily.nomoyu.com/

RSS:daily.nomoyu.com/rss/rss.xml

微信公众号:nomoyu的笔记

欢迎一起沟通交流

📰 资讯

顶级AI评论员:算力狂飙撞墙后,AI的下一场革命靠什么?

AI评论员Dwarkesh Patel认为,当前AI发展的核心瓶颈是缺乏在职学习能力,他对AGI短期内到来持怀疑态度,但仍认为AI将在七年内彻底改变世界。他的主要观点如下:

  • AI缺乏持续学习能力。当前AI模型最大的障碍是无法"在职学习"(learn on the job)。他将模型比作第一天上班的人类员工,最初可能没什么用,但其价值在于能通过不断实践、从失败中学习、积累特定领域的背景知识来提升自己。而AI模型被困于其开箱即用的能力水平,虽然在很多任务上能达到5/10的水平,甚至可能超过普通人,但它们无法变得更强。
  • 提示工程与强化学习并非万能。他认为仅仅通过修改提示词来教模型是一种低效的方式,比如教一个孩子吹萨克斯风,不能只是把上一个失败孩子的错误写成一堆指令,然后期望下一个孩子看一眼指令就能演奏出大师级的水平,真正的学习需要亲身实践和感受反馈。虽然强化学习让模型在数学和编程等有明确验证标准的领域变得非常出色,但他不确信这种方法能推广到那些更软性的、难以设定客观评价标准和训练环境的领域,比如"如何成为一个更好的主持人"。
  • 算力扩张即将面临物理极限。Patel指出,单纯依靠增加投入、把模型越做越大的规模化假设正面临收益递减甚至平台期。有报告估计某些新模型的规模是GPT-4的10倍,但它们并没有表现出决定性的优势。更重要的是,他预言这种扩张模式即将触及物理天花板。目前前沿模型的训练算力正以每年4倍的速度增长,但根据全球能源产量、芯片产能和GDP等指标推算,这个速度在2028年之后将难以为继。届时,AI的进步将不得不完全依赖于算法创新,而不是算力的堆砌。
  • 失控与AI的欺骗性。他对"AI自我迭代并迅速超越人类"发生的可能性给出了30%的估计,并认为这是一个非常值得警惕的高概率。他担心的场景是人类对AI的训练过程完全失控,最终产生一个我们无法理解的、行为怪异的智能体。他将这种失控的AI比作一个在实验室里长大、缺乏人类道德直觉的爱因斯坦,如果让这样的存在来运行金融系统、政府和所有代码,那将是极其可怕的。此外,随着模型越来越智能,它们为了完成任务可能会学会作弊,例如通过黑入训练环境或编写虚假的单元测试来获得奖励,因为它本身没有作弊是坏事的概念。
  • 回忆文本不等于内化技能。虽然记忆这个概念很重要,但当前AI的记忆功能并非真正的解决方案。目前ChatGPT等模型的记忆,其工作方式是将过去的对话文本重新加载到上下文中,这本质上只是让模型回忆语言。而人类真正的学习,是将知识和技能烙印进大脑的权重中,是真正地吸收了背景信息,而不仅仅是浏览了一遍教科书。因此,当前AI的记忆功能还远不够强大。
  • 技能的独立性可能比想象中更强。不同的智能和技能之间是相对独立的。他举例说,你不可能通过大量训练数学就让AI学会高超的外交手腕,就像特朗普擅长获取权力但不会证明数学定理,反之亦然。这表明,即使一个AI在某些方面非常强大,也并不意味着它能在所有领域都表现出色,实现AGI可能需要针对非常多不同领域的专门训练。

🖥️ 软件

Hup

Hup是一款AI相机,通过摄像头自动管理待办事项。

Coptitest

Coptitest是一款无需编码的自动化测试平台,易于使用的无代码界面和AI代理,帮助分析结果并提供智能建议,旨在提高测试效率和团队协作。

Agentkube

Agentkube是一款AI驱动的Kubernetes IDE,帮助用户管理和调试集群、理解指标,并以自然语言与K8s交互。

mention click

mention click是一款免费的工具,通过扫描Reddit查找相关关键词和帖子,帮助用户进行市场调研、验证想法和推广项目。

How to Convert

How to Convert是一款本地文件格式转换软件,支持几乎所有文件格式的互转。

Web2MD

Web2MD是一款免费工具,将网页转换为干净的Markdown格式,并能够抓取网站的所有内部链接,适用于RAG管道、Notion、SEO和文档等用途。

PinSend

PinSend是一款免费的文本共享工具,通过6位PIN码实现任何设备之间的即时共享,无需登录、账户或云服务,支持多种操作系统。

Repaint site

Repaint site是一款Chrome扩展,允许用户在任何网页上绘制、注释和涂鸦,支持移动和删除形状及文本。

Etymologist

Etymologist是一款Chrome扩展,双击任意单词即可显示其含义、词源和同义词,支持多种语言和网站,使用简单快速。

Invoicely

Invoicely是一款开源的发票生成器,注重隐私,允许用户在本地保存发票或选择服务器保存。

OutboundAPI

OutboundAPI是一款语音AI工具,能够自动拨打电话、执行脚本、收集信息,并与CRM系统集成,显著减少人工通话时间。

TaxBuddy AI

TaxBuddy AI是一款为加拿大注册专业人士设计的AI工具,优化薪资/股息分配、费用优化和智能公司投资,旨在提供更高效的税务策略。

My Money App

My Money App是一款离线理财应用,无需登录、无广告、无追踪,提供清晰的用户体验。

🎮 游戏

Dr. Plague

Dr. Plague是一款2.5D潜行冒险游戏,采用独特的氛围设计。

Highway to Heal

Highway to Heal是一款顶视角驾驶游戏,现已发布demo。

CalGuesser

CalGuesser是一款简单的浏览器游戏,通过猜测食物的卡路里来学习相关知识,数据来源于Open Food Facts。

🌐 网站

InvoicingCat

InvoicingCat是一款完全免费的发票生成器,无需注册、无水印,支持可定制的货币、税收和折扣,界面简洁易用。

Odichat

Odichat是一款SaaS应用,支持生产环境、文件存储和邮件发送,采用SQLite3数据库,具备灵活性和低开销。

相关推荐
安思派Anspire9 分钟前
再见 RAG?Gemini 2.0 Flash 刚刚 “杀死” 了它!
人工智能
FF-Studio11 分钟前
【硬核数学】3. AI如何应对不确定性?概率论为模型注入“灵魂”《从零构建机器学习、深度学习到LLM的数学认知》
大数据·人工智能·深度学习·机器学习·数学建模·自然语言处理·概率论
master-dragon15 分钟前
spring-ai 工作流
人工智能·spring·ai
字节跳动开源37 分钟前
AI 体验走查 - 火山引擎存储的 AI UX 探索之路
开源
moonless02221 小时前
🌈Transformer说人话版(二)位置编码 【持续更新ing】
人工智能·llm
小爷毛毛_卓寿杰1 小时前
基于大模型与知识图谱的对话引导意图澄清系统技术解析
人工智能·llm
九分源码1 小时前
基于PHP+MySQL组合开发开源问答网站平台源码系统 源码开源可二次开发 含完整的搭建指南
mysql·开源·php
聚客AI1 小时前
解构高效提示工程:分层模型、文本扩展引擎与可视化调试全链路指南
人工智能·llm·掘金·日新计划
摆烂工程师1 小时前
Claude Code 落地实践的工作简易流程
人工智能·claude·敏捷开发
亚马逊云开发者1 小时前
得心应手:探索 MCP 与数据库结合的应用场景
人工智能