AI Daily | AI日报:Altman:GPT - 5将引发就业与欺诈变革; OpenAI 新模型多场竞赛‘翻车’,谷歌躺赢!; 黄仁勋:报废50亿显卡,员工薪酬全加薪

All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。 欢迎关注公众号「AI Reading Hub」,获取更多AI资讯和技术文章。

2025-07-26 资讯日报

新闻资讯

Altman:GPT - 5将引发就业与欺诈变革

OpenAI 的 Altman 称 GPT - 5 几乎各方面比人类聪明,会使部分职业消失,如客服。他也指出 AI 虽益处大,但会带来欺诈危机,且其影响难预测,同时强调人类工作根本因素不会因技术改变。>阅读原文

OpenAI 新模型多场竞赛'翻车',谷歌躺赢!

近期 OpenAI 多款新模型登场。在 IMO 竞赛,其称新模型获金牌遭质疑,谷歌同获金牌受认可;'o3 Alpha'疑似上线;前 OpenAI 员工在编程赛击败 OpenAI 模型,不过 AI 发展或很快占据榜首。>阅读原文

黄仁勋:报废50亿显卡,员工薪酬全加薪

黄仁勋称报废50亿美元显卡,H100芯片先下单先得。他亲自审查员工薪酬,100%加薪。认为AI是技术均衡器,天价AI合同合理,还认可小团队能量,看好AI工厂前景。>阅读原文

吴恩达:AI创业拼速度,代码不重要

吴恩达:AI创业成败关键在执行速度,最大机会在应用层。想法要具体,善用AI编程工具,团队应保持技术敏感。他还认为AGI被炒作,多数创业公司不必担心token成本。>阅读原文

哈萨比斯:五年内一半几率实现AGI

谷歌DeepMind掌门人Demis Hassabis称未来五年有50%几率实现AGI,认为自然界模式可被经典算法建模。他还谈及AI将变革游戏,可模拟细胞、探寻生命起源,解决P与NP等问题。>阅读原文

世纪华通AI游戏大赛线下路演收官

世纪华通王佶:'数龙杯'旨在挖掘AI项目与人才,搭建跨界交流平台。7月23日大赛线下路演,20余团队展示成果,8月1日ChinaJoy揭晓最终结果。>阅读原文

大模型竞赛:决胜关键在后训练

大模型竞赛转向后训练。Grok 4靠后训练成"宇宙最强",展现其重要性。通用模型落地遇难题,后训练是解决之道。夸克高考大模型后训练是范例,阿里云为后训练提供全栈支撑。>阅读原文

谷歌晒IMO金牌团队照,无惧被挖

谷歌获IMO金牌后,小扎挖走三名核心成员。谷歌团队不信邪晒全家福,负责人Thang Luong分享准备细节,还介绍团队16人名单,含4位华人成员,此前被挖3人未在其中。>阅读原文

NeurIPS现逆天评审,AI评审成趋势

NeurIPS 2025评审结果公布,有评审把Adam优化器当成拼写错误引关注。投稿量近3万,人力难审,AI评审普遍。还推荐了写反驳意见的博客,邀中稿者给AIXiv投稿。>阅读原文

赵晟佳出任Meta超级智能首席科学家

Meta官宣赵晟佳任超级智能实验室首席科学家。他是ChatGPT等模型核心功臣。Meta为组团队挖人、给高薪,还准备大规模算力,与OpenAI等竞争激烈。>阅读原文

DeepSeek一体机:高端失宠,中低端混战

上半年,国央企等采购让头部硬件厂商在一体机市场赚得盆满钵满,中小厂商遇冷。下半年,高端市场饱和,中低端"游击战"开启,部分厂商换国产芯片。已售一体机落地不佳,需杀手级应用和用户数据。>阅读原文

伦敦政经中心揭秘AI与动物感知奥秘

伦敦政经学院Jeremy Coller动物感知中心将研究动物意识。其项目探索AI助人与宠物交流的潜力和风险,还关注动物福利伦理,如无人驾驶与农业养殖等问题。>阅读原文

顶级AI专家论道AGI与世界模型

2025基础科学与人工智能论坛上,顾险峰等专家指出AI缺乏因果建模,讨论了token范式与世界模型,认为AI原创能力有限,还提及高能效计算及新学习范式,强调理论与系统需突破。>阅读原文

996工作制席卷硅谷,争议与风险并存

996工作制在欧美AI等初创企业蔓延,源于对速度的追求和马斯克等影响。部分公司用此筛选员工,也有分层推进。但引发争议,存在法律风险,还可能掩盖管理问题。>阅读原文

陶哲轩:AI发展要'降本增效'

陶哲轩:对不同 AI 模型在竞赛中的表现应谨慎看待,AI 发展需从定性转向定量'降本增效',未来标准化评测机制至关重要,当前自我报告成果方式待改进。>阅读原文

GPT - 5:编程能力大提升

The Information报道,OpenAI的GPT - 5早期反馈好。它能整合语言与推理模型,编程能力提升显著,有望赢开发者青睐,但形式待明确,改进或多在后训练阶段。>阅读原文

具身智能:瓶颈在智能,通用模型被低估

Physical Intelligence联创等认为,具身智能当前瓶颈在智能软件,非硬件。实现具身智能有能力、泛化、性能三大难关,前两者已突破,性能是从演示到部署的最大障碍,通用机器人基础模型价值被低估。>阅读原文

OpenAI新Agent接近"自我进化"边缘

OpenAI 团队成员:新款 ChatGPT Agent 结合多工具、共享状态,可执行复杂任务。通过强化学习训练,虽面临安全挑战,但已在数据科学等方面表现出色,未来将提升其多任务处理能力。>阅读原文

阿里三连发模型,暴击美国AI计划

美国发布AI行动计划,阿里7月22 - 25日连发三款模型回击。千问3在多领域表现优异,成全球最强非推理模型等。虽有使用费用小插曲,但开源让全球开发者看到中国AI实力。>阅读原文

产品应用

Captain Cinema:让短片变电影

约翰·霍普金斯大学与字节Seed团队推出Captain Cinema系统,以剧情文字生成短片,用交错式训练和MM - DiT模型。虽不能一键成视频、需剧本、依赖数据,但为自动化电影生成迈进重要一步。>阅读原文

Apache RocketMQ助力AI应用拥抱事件驱动架构

阿里云消息团队:AIGC浪潮下,AI应用构建面临挑战,需异步通信机制。Apache RocketMQ有两大创新,通过"会话即主题"等方案解决难题,经实践验证,未来将推动AI MQ成行业标准。>阅读原文

RDS Supabase:小白轻松开发AI应用!

阿里云 RDS 与 Supabase 融合,为 AI 应用开发带来新范式。相比传统模式,它在效率、成本、扩展性上更优。文中还给出基于 RDS Supabase 开发简易 Agentic RAG 应用的详细步骤。>阅读原文

西门子:用AI开启工业制造新纪元

西门子用150PB工业数据和百年工程知识打造工业基础模型。Industrial Copilot可生成代码,提升开发效率。其工业智能体系统如指挥家,能调度任务。深厚积淀让对手难复制,还将在中国首秀。>阅读原文

实测:GPT Agent是最强通用Agent

作者实测GPT Agent后,认为它是最强通用Agent。PPT实测要给详细提示词,与Manus对比,它更像人般操作解决问题,呼吁大家实测,别盲目拉踩。>阅读原文

Qwen3双模型出击,Gemini2.5 pro难招架

Qwen:推出非推理模型Qwen3-235B-A22B-Instruct-2507后,又推推理模型Qwen3-235B-A22B-Thinking-2507,更新快,推理模型能力强,可试用。>阅读原文

九条建议教你从ChatGPT拿流量

AI问答引擎成产品认知关键关口,用户习惯让其推荐产品。优化目标是进入推荐,催生AEO。文章给出九条建议,如明确提问场景、创作专业内容、关注引用动态等,助品牌获流量。>阅读原文

Grab:订阅平台从SQS和Redis切换到Temporal

Grab将订阅平台从SQS和Redis切换到Temporal,原架构随订阅者增多问题不断,新架构利用Temporal特性,减少生产事件80%,提升系统鲁棒性与可扩展性。>阅读原文

阶跃星辰:用 JuiceFS 打造大模型存储平台

阶跃星辰为支撑多模态模型研发,因早期存储系统不足引入 JuiceFS。其大模型各环节对存储要求高,团队在企业版和社区版做多项优化,如模型分发缓存、读性能、客户端稳定等优化,分享一线经验。>阅读原文

推荐文章

Surge AI:高质量数据破局 AI 竞争

Surge AI 成立几年业绩爆发,2024 年 ARR 超 10 亿美元。它聚焦高质量数据标注,客户多为顶级科技公司。2025 年 7 月启动融资,认为高质量数据是 AGI 竞赛关键,人工与合成数据互补。>阅读原文

谷歌Denny Zhou:揭秘大模型推理课

谷歌DeepMind推理负责人Denny Zhou在斯坦福授课。大模型推理指给出答案前的思考步骤,可让复杂问题可解、提升答案准确性。还介绍了让模型输出推理答案的方法,总结了提升推理能力要点。>阅读原文

博世XC:像创业公司一样战斗

智能化浪潮下,博世XC起初交付遇困、订单减少。吴永桥与李金龙两大改革派汇合,带领团队像创业公司战斗,订单量显著增长。未来其将降本与研发两手抓,目标占非自研市场50%份额。>阅读原文

DHH:AI难取代程序员创造力

丹麦程序员DHH在访谈中称,静态类型语言安全感是错觉,微服务不适合中小团队。他认为AI不能替代人类创造力,程序员核心竞争力是问题定义和架构审美,创业应追求长期自我实现。>阅读原文

开源动态

阿里开源WebSailor,Github增长表现亮眼

人类信息检索能力不足,OpenAI闭源产品虽能解决但不利技术发展。阿里通义实验室开源WebSailor,测试表现出色,其核心技术围绕复杂任务生成和强化学习,在Github获超5000星且有日增第一佳绩。>阅读原文

字节跳动开源AI Agent开发平台Coze

字节跳动:开源AI Agent开发平台Coze,含Coze Studio和Coze Loop,采用宽松协议、低安装门槛,以"应用层封闭,基础层开放"策略构建生态闭环,争夺定义未来门票。>阅读原文

Agent KB 开源,智能体经验共享性能跃升

OPPO 等机构团队发布 Agent KB 框架,构建经验池解决智能体经验共享难题。GAIA 测试中,提升多模型 Pass@1 性能,Claude - 3.7 增幅 6.66 个百分点。还在软件工程领域发挥作用,为 AI 系统进化提供支撑。>阅读原文

阿里开源ComfyUI - Copilot,一键生成AIGC工作流

阿里开源ComfyUI - Copilot,为ComfyUI配备AI助手。可通过自然语言交互实现节点搜索、工作流构建等功能,将搭建时间从数小时缩至分钟,效率提升10倍不止。>阅读原文

阿里 Qwen3 推理模型登场,社区反响热烈

阿里通义千问本周连发三款 Qwen3 系列模型,包括基础、编程和推理模型。推理模型能力强,原生支持长上下文。Qwen API 在 OpenRouter 表现亮眼,获社区高度关注。>阅读原文

蚂蚁数科金融大模型超DeepSeek刷新SOTA

蚂蚁数科:金融推理大模型Agentar - Fin - R1已上线,超DeepSeek等刷新SOTA。该模型兼顾专业与通用,团队还提出更严苛评测基准Finova,凸显垂直模型优势。>阅读原文

李沐开源Higgs Audio v2,音频模型新突破

7月23日李沐开源Higgs Audio v2,构建于Llama - 3.2 - 3B。该模型在测评中表现佳,有多种能力。李沐介绍其架构、训练方法,团队通过技术创新让模型融合语音与文本数据。>阅读原文

阿里 Qwen3 连发三模型,开源实力惊人!

阿里近期连发三款 Qwen3 系列模型,在通用、编码、推理方向发力,拿下多个开源榜单第一。其持续迭代的体系感获认可,背后是阿里全栈 AI 布局和大投入,将打开 AI 应用创新空间。>阅读原文

Focalboard:开源免费的项目管理神器

小华:Focalboard 开源且免费,能解决团队协作和项目管理的痛点。它功能全,支持多视图任务管理、本地部署等,可在多种场景使用,还能与 Mattermost 集成。>阅读原文

算法论文

王旭等:增强MFNN重构多源气动数据

香港理工大学王旭等提出增强MFNN的多源气动数据重构方法。在传统MFNN融入差分方法层,构建MFNN_DM。经测试,该方法提升泛化能力,重构精度较传统方法提高超30%。>阅读原文

西交大团队提出气动外形优化新框架

西交大刘子扬、陈刚等提出智能化气动外形优化经验学习框架,结合DNN与DRL,利用流场信息指导优化。还提出相关技术与奖赏函数,经超临界翼型任务验证,成功率超80%,为气动优化提供新方法。>阅读原文

清华&生数:Vidar模型突破机器人操作困境

清华与生数科技推出Vidar模型,用少样本泛化实现虚拟到现实物理操作跨越。仅20分钟真机数据,数据量大幅降低。突破跨本体困境,为服务机器人应用提供技术支撑。>阅读原文

阿里云CRFT提升思维链推理能力

阿里云智能飞天实验室提出CRFT方法,通过信息流分析识别关键表征并优化。在多基准和模型验证有效,提高推理准确率,学习参数量低,还能适应少样本学习场景。>阅读原文

BLIP3 - o:统一图像生成与理解

BLIP3 - o融合自回归与扩散模型,统一图像表示和任务空间。用预训练Qwen 2.5 VL构建模块,经指令微调,在图像理解和生成测试表现好,生成图像更合人类偏好。>阅读原文

TTD-DR:让Deep Researcher错误率直降70%

论文提出TTD-DR,将报告生成建模为扩散过程,有检索增强去噪和组件自进化机制。实验表明其在多领域超现有方案,自进化丰富信息,去噪加速学习,计算效率优,或推动AI成认知协作者。>阅读原文

港科大&北京人形:LOVON革新足式机器人导航

港科大广州与北京人形创新中心推出LOVON框架,它融合多种能力,解决足式机器人在开放世界的导航难题。有抗干扰视觉处理和自适应执行逻辑,性能超传统方法,应用前景广。>阅读原文

揭秘大模型上下文学习隐式权重更新机制

研究揭示大型语言模型上下文学习机制,自注意力层将提示信息转化为MLP层低秩权重更新,实现推理时"隐式微调",虽有局限,但为后续研究奠定基础。>阅读原文

bash 复制代码
    </p>
    

官网:www.AiReadingHub.com

相关推荐
PetterHillWater4 小时前
AI应用与教育行业
aigc
AI大模型5 小时前
大厂LLM应用岗上岸面经:面28家拿offer,拆解“必问考点+避坑指南”
程序员·llm·agent
月小水长7 小时前
面试了全球首个 AI 全栈高级 IDE CodeBuddy,当场就下了 Offer
面试·程序员
陈随易7 小时前
牛回,速归!VSCode开启AI的野兽模式究竟有多强
前端·后端·程序员
数据智能老司机12 小时前
构建由 LLM 驱动的 Neo4j 应用程序——揭开 RAG 的神秘面纱
langchain·llm·aigc
数据智能老司机12 小时前
构建由 LLM 驱动的 Neo4j 应用程序——构建智能应用的知识图谱基础理解
langchain·llm·aigc
数据智能老司机12 小时前
构建由 LLM 驱动的 Neo4j 应用程序——使用电影数据集构建你的Neo4j图数据库
langchain·llm·aigc
win4r13 小时前
🚀Claude Code重磅推出Sub agents功能!轻松实现任务专业化和模块化!三分钟完美复现Kiro工作流,规范驱动开发时代正式到来!
aigc·claude·vibecoding
数据智能老司机13 小时前
构建由 LLM 驱动的 Neo4j 应用程序——LLM、RAG 与 Neo4j 知识图谱简介
langchain·llm·aigc