All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。 欢迎关注公众号「AI Reading Hub」,获取更多AI资讯和技术文章。
2025-07-26 资讯日报
新闻资讯
Altman:GPT - 5将引发就业与欺诈变革
OpenAI 的 Altman 称 GPT - 5 几乎各方面比人类聪明,会使部分职业消失,如客服。他也指出 AI 虽益处大,但会带来欺诈危机,且其影响难预测,同时强调人类工作根本因素不会因技术改变。>阅读原文
OpenAI 新模型多场竞赛'翻车',谷歌躺赢!
近期 OpenAI 多款新模型登场。在 IMO 竞赛,其称新模型获金牌遭质疑,谷歌同获金牌受认可;'o3 Alpha'疑似上线;前 OpenAI 员工在编程赛击败 OpenAI 模型,不过 AI 发展或很快占据榜首。>阅读原文
黄仁勋:报废50亿显卡,员工薪酬全加薪
黄仁勋称报废50亿美元显卡,H100芯片先下单先得。他亲自审查员工薪酬,100%加薪。认为AI是技术均衡器,天价AI合同合理,还认可小团队能量,看好AI工厂前景。>阅读原文
吴恩达:AI创业拼速度,代码不重要
吴恩达:AI创业成败关键在执行速度,最大机会在应用层。想法要具体,善用AI编程工具,团队应保持技术敏感。他还认为AGI被炒作,多数创业公司不必担心token成本。>阅读原文
哈萨比斯:五年内一半几率实现AGI
谷歌DeepMind掌门人Demis Hassabis称未来五年有50%几率实现AGI,认为自然界模式可被经典算法建模。他还谈及AI将变革游戏,可模拟细胞、探寻生命起源,解决P与NP等问题。>阅读原文
世纪华通AI游戏大赛线下路演收官
世纪华通王佶:'数龙杯'旨在挖掘AI项目与人才,搭建跨界交流平台。7月23日大赛线下路演,20余团队展示成果,8月1日ChinaJoy揭晓最终结果。>阅读原文
大模型竞赛:决胜关键在后训练
大模型竞赛转向后训练。Grok 4靠后训练成"宇宙最强",展现其重要性。通用模型落地遇难题,后训练是解决之道。夸克高考大模型后训练是范例,阿里云为后训练提供全栈支撑。>阅读原文
谷歌晒IMO金牌团队照,无惧被挖
谷歌获IMO金牌后,小扎挖走三名核心成员。谷歌团队不信邪晒全家福,负责人Thang Luong分享准备细节,还介绍团队16人名单,含4位华人成员,此前被挖3人未在其中。>阅读原文
NeurIPS现逆天评审,AI评审成趋势
NeurIPS 2025评审结果公布,有评审把Adam优化器当成拼写错误引关注。投稿量近3万,人力难审,AI评审普遍。还推荐了写反驳意见的博客,邀中稿者给AIXiv投稿。>阅读原文
赵晟佳出任Meta超级智能首席科学家
Meta官宣赵晟佳任超级智能实验室首席科学家。他是ChatGPT等模型核心功臣。Meta为组团队挖人、给高薪,还准备大规模算力,与OpenAI等竞争激烈。>阅读原文
DeepSeek一体机:高端失宠,中低端混战
上半年,国央企等采购让头部硬件厂商在一体机市场赚得盆满钵满,中小厂商遇冷。下半年,高端市场饱和,中低端"游击战"开启,部分厂商换国产芯片。已售一体机落地不佳,需杀手级应用和用户数据。>阅读原文
伦敦政经中心揭秘AI与动物感知奥秘
伦敦政经学院Jeremy Coller动物感知中心将研究动物意识。其项目探索AI助人与宠物交流的潜力和风险,还关注动物福利伦理,如无人驾驶与农业养殖等问题。>阅读原文
顶级AI专家论道AGI与世界模型
2025基础科学与人工智能论坛上,顾险峰等专家指出AI缺乏因果建模,讨论了token范式与世界模型,认为AI原创能力有限,还提及高能效计算及新学习范式,强调理论与系统需突破。>阅读原文
996工作制席卷硅谷,争议与风险并存
996工作制在欧美AI等初创企业蔓延,源于对速度的追求和马斯克等影响。部分公司用此筛选员工,也有分层推进。但引发争议,存在法律风险,还可能掩盖管理问题。>阅读原文
陶哲轩:AI发展要'降本增效'
陶哲轩:对不同 AI 模型在竞赛中的表现应谨慎看待,AI 发展需从定性转向定量'降本增效',未来标准化评测机制至关重要,当前自我报告成果方式待改进。>阅读原文
GPT - 5:编程能力大提升
The Information报道,OpenAI的GPT - 5早期反馈好。它能整合语言与推理模型,编程能力提升显著,有望赢开发者青睐,但形式待明确,改进或多在后训练阶段。>阅读原文
具身智能:瓶颈在智能,通用模型被低估
Physical Intelligence联创等认为,具身智能当前瓶颈在智能软件,非硬件。实现具身智能有能力、泛化、性能三大难关,前两者已突破,性能是从演示到部署的最大障碍,通用机器人基础模型价值被低估。>阅读原文
OpenAI新Agent接近"自我进化"边缘
OpenAI 团队成员:新款 ChatGPT Agent 结合多工具、共享状态,可执行复杂任务。通过强化学习训练,虽面临安全挑战,但已在数据科学等方面表现出色,未来将提升其多任务处理能力。>阅读原文
阿里三连发模型,暴击美国AI计划
美国发布AI行动计划,阿里7月22 - 25日连发三款模型回击。千问3在多领域表现优异,成全球最强非推理模型等。虽有使用费用小插曲,但开源让全球开发者看到中国AI实力。>阅读原文
产品应用
Captain Cinema:让短片变电影
约翰·霍普金斯大学与字节Seed团队推出Captain Cinema系统,以剧情文字生成短片,用交错式训练和MM - DiT模型。虽不能一键成视频、需剧本、依赖数据,但为自动化电影生成迈进重要一步。>阅读原文
Apache RocketMQ助力AI应用拥抱事件驱动架构
阿里云消息团队:AIGC浪潮下,AI应用构建面临挑战,需异步通信机制。Apache RocketMQ有两大创新,通过"会话即主题"等方案解决难题,经实践验证,未来将推动AI MQ成行业标准。>阅读原文
RDS Supabase:小白轻松开发AI应用!
阿里云 RDS 与 Supabase 融合,为 AI 应用开发带来新范式。相比传统模式,它在效率、成本、扩展性上更优。文中还给出基于 RDS Supabase 开发简易 Agentic RAG 应用的详细步骤。>阅读原文
西门子:用AI开启工业制造新纪元
西门子用150PB工业数据和百年工程知识打造工业基础模型。Industrial Copilot可生成代码,提升开发效率。其工业智能体系统如指挥家,能调度任务。深厚积淀让对手难复制,还将在中国首秀。>阅读原文
实测:GPT Agent是最强通用Agent
作者实测GPT Agent后,认为它是最强通用Agent。PPT实测要给详细提示词,与Manus对比,它更像人般操作解决问题,呼吁大家实测,别盲目拉踩。>阅读原文
Qwen3双模型出击,Gemini2.5 pro难招架
Qwen:推出非推理模型Qwen3-235B-A22B-Instruct-2507后,又推推理模型Qwen3-235B-A22B-Thinking-2507,更新快,推理模型能力强,可试用。>阅读原文
九条建议教你从ChatGPT拿流量
AI问答引擎成产品认知关键关口,用户习惯让其推荐产品。优化目标是进入推荐,催生AEO。文章给出九条建议,如明确提问场景、创作专业内容、关注引用动态等,助品牌获流量。>阅读原文
Grab:订阅平台从SQS和Redis切换到Temporal
Grab将订阅平台从SQS和Redis切换到Temporal,原架构随订阅者增多问题不断,新架构利用Temporal特性,减少生产事件80%,提升系统鲁棒性与可扩展性。>阅读原文
阶跃星辰:用 JuiceFS 打造大模型存储平台
阶跃星辰为支撑多模态模型研发,因早期存储系统不足引入 JuiceFS。其大模型各环节对存储要求高,团队在企业版和社区版做多项优化,如模型分发缓存、读性能、客户端稳定等优化,分享一线经验。>阅读原文
推荐文章
Surge AI:高质量数据破局 AI 竞争
Surge AI 成立几年业绩爆发,2024 年 ARR 超 10 亿美元。它聚焦高质量数据标注,客户多为顶级科技公司。2025 年 7 月启动融资,认为高质量数据是 AGI 竞赛关键,人工与合成数据互补。>阅读原文
谷歌Denny Zhou:揭秘大模型推理课
谷歌DeepMind推理负责人Denny Zhou在斯坦福授课。大模型推理指给出答案前的思考步骤,可让复杂问题可解、提升答案准确性。还介绍了让模型输出推理答案的方法,总结了提升推理能力要点。>阅读原文
博世XC:像创业公司一样战斗
智能化浪潮下,博世XC起初交付遇困、订单减少。吴永桥与李金龙两大改革派汇合,带领团队像创业公司战斗,订单量显著增长。未来其将降本与研发两手抓,目标占非自研市场50%份额。>阅读原文
DHH:AI难取代程序员创造力
丹麦程序员DHH在访谈中称,静态类型语言安全感是错觉,微服务不适合中小团队。他认为AI不能替代人类创造力,程序员核心竞争力是问题定义和架构审美,创业应追求长期自我实现。>阅读原文
开源动态
阿里开源WebSailor,Github增长表现亮眼
人类信息检索能力不足,OpenAI闭源产品虽能解决但不利技术发展。阿里通义实验室开源WebSailor,测试表现出色,其核心技术围绕复杂任务生成和强化学习,在Github获超5000星且有日增第一佳绩。>阅读原文
字节跳动开源AI Agent开发平台Coze
字节跳动:开源AI Agent开发平台Coze,含Coze Studio和Coze Loop,采用宽松协议、低安装门槛,以"应用层封闭,基础层开放"策略构建生态闭环,争夺定义未来门票。>阅读原文
Agent KB 开源,智能体经验共享性能跃升
OPPO 等机构团队发布 Agent KB 框架,构建经验池解决智能体经验共享难题。GAIA 测试中,提升多模型 Pass@1 性能,Claude - 3.7 增幅 6.66 个百分点。还在软件工程领域发挥作用,为 AI 系统进化提供支撑。>阅读原文
阿里开源ComfyUI - Copilot,一键生成AIGC工作流
阿里开源ComfyUI - Copilot,为ComfyUI配备AI助手。可通过自然语言交互实现节点搜索、工作流构建等功能,将搭建时间从数小时缩至分钟,效率提升10倍不止。>阅读原文
阿里 Qwen3 推理模型登场,社区反响热烈
阿里通义千问本周连发三款 Qwen3 系列模型,包括基础、编程和推理模型。推理模型能力强,原生支持长上下文。Qwen API 在 OpenRouter 表现亮眼,获社区高度关注。>阅读原文
蚂蚁数科金融大模型超DeepSeek刷新SOTA
蚂蚁数科:金融推理大模型Agentar - Fin - R1已上线,超DeepSeek等刷新SOTA。该模型兼顾专业与通用,团队还提出更严苛评测基准Finova,凸显垂直模型优势。>阅读原文
李沐开源Higgs Audio v2,音频模型新突破
7月23日李沐开源Higgs Audio v2,构建于Llama - 3.2 - 3B。该模型在测评中表现佳,有多种能力。李沐介绍其架构、训练方法,团队通过技术创新让模型融合语音与文本数据。>阅读原文
阿里 Qwen3 连发三模型,开源实力惊人!
阿里近期连发三款 Qwen3 系列模型,在通用、编码、推理方向发力,拿下多个开源榜单第一。其持续迭代的体系感获认可,背后是阿里全栈 AI 布局和大投入,将打开 AI 应用创新空间。>阅读原文
Focalboard:开源免费的项目管理神器
小华:Focalboard 开源且免费,能解决团队协作和项目管理的痛点。它功能全,支持多视图任务管理、本地部署等,可在多种场景使用,还能与 Mattermost 集成。>阅读原文
算法论文
王旭等:增强MFNN重构多源气动数据
香港理工大学王旭等提出增强MFNN的多源气动数据重构方法。在传统MFNN融入差分方法层,构建MFNN_DM。经测试,该方法提升泛化能力,重构精度较传统方法提高超30%。>阅读原文
西交大团队提出气动外形优化新框架
西交大刘子扬、陈刚等提出智能化气动外形优化经验学习框架,结合DNN与DRL,利用流场信息指导优化。还提出相关技术与奖赏函数,经超临界翼型任务验证,成功率超80%,为气动优化提供新方法。>阅读原文
清华&生数:Vidar模型突破机器人操作困境
清华与生数科技推出Vidar模型,用少样本泛化实现虚拟到现实物理操作跨越。仅20分钟真机数据,数据量大幅降低。突破跨本体困境,为服务机器人应用提供技术支撑。>阅读原文
阿里云CRFT提升思维链推理能力
阿里云智能飞天实验室提出CRFT方法,通过信息流分析识别关键表征并优化。在多基准和模型验证有效,提高推理准确率,学习参数量低,还能适应少样本学习场景。>阅读原文
BLIP3 - o:统一图像生成与理解
BLIP3 - o融合自回归与扩散模型,统一图像表示和任务空间。用预训练Qwen 2.5 VL构建模块,经指令微调,在图像理解和生成测试表现好,生成图像更合人类偏好。>阅读原文
TTD-DR:让Deep Researcher错误率直降70%
论文提出TTD-DR,将报告生成建模为扩散过程,有检索增强去噪和组件自进化机制。实验表明其在多领域超现有方案,自进化丰富信息,去噪加速学习,计算效率优,或推动AI成认知协作者。>阅读原文
港科大&北京人形:LOVON革新足式机器人导航
港科大广州与北京人形创新中心推出LOVON框架,它融合多种能力,解决足式机器人在开放世界的导航难题。有抗干扰视觉处理和自适应执行逻辑,性能超传统方法,应用前景广。>阅读原文
揭秘大模型上下文学习隐式权重更新机制
研究揭示大型语言模型上下文学习机制,自注意力层将提示信息转化为MLP层低秩权重更新,实现推理时"隐式微调",虽有局限,但为后续研究奠定基础。>阅读原文
bash
</p>