AI Daily | AI日报:谷歌天价挖人,Cognition逆袭接盘Windsurf; OpenAI研究员:规范将成软件开发核心; OpenAI新模型IMO 2025测试获金牌

All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。 欢迎关注公众号「AI Reading Hub」,获取更多AI资讯和技术文章。

2025-07-20 资讯日报

新闻资讯

谷歌天价挖人,Cognition逆袭接盘Windsurf

7月,谷歌以优厚条件挖走Windsurf部分顶尖团队,还签24亿许可协议。周一Cognition收购其剩余资产和员工。此前OpenAI收购因技术共享谈崩,Windsurf还遭遇模型使用难题。>阅读原文

OpenAI研究员:规范将成软件开发核心

OpenAI研究员Sean Grove称AI时代清晰规范将取代代码成软件开发核心,编程核心是沟通。有人认为像瀑布模型回魂,也有人反对,但这代表AI编程重要转折,人类程序员价值或转向"定方向"。>阅读原文

OpenAI新模型IMO 2025测试获金牌

OpenAI:新模型在2025 IMO测试中获金牌,不借助工具、不联网,解决6题中5题,非GPT - 5,近期不发布。这实力,简直开挂!>阅读原文

离职员工揭秘 OpenAI Codex 开发内幕

Calvin French - Owen 曾参与 OpenAI Codex 开发。他称 OpenAI 研究文化自下而上,扩张快致沟通等不同步,最大成本是 GPU 算力。Codex 7 周发布,成绩亮眼,未来编程工具或向其形态发展。>阅读原文

奥特曼暗示:GPT - 5即将发布!

OpenAI合作测试方文件意外泄露GPT - 5信息,暗示将把推理能力提升新高度。OpenAI CEO等暗示GPT - 5即将发布,但暂不推出有IMO金牌级别数学能力的正式产品。>阅读原文

Sam Altman:GPT - 5即将发布

Sam Altman宣布OpenAI通用推理系统在2025年IMO达金牌水平,且GPT - 5即将发布。研究员Alexander Wei介绍模型表现,解决多道题获高分。不过有金牌能力的版本要等几个月。>阅读原文

Claude Code悄悄限流,用户信任亮红灯!

Claude Code付费用户突遭限流,Anthropic未预告说明,开发者不满。此前产品经理从Cursor回归,或带回'经验'。其定价不明,用户呼吁透明沟通,否则将因竞争激烈而失去用户。>阅读原文

Meta超级智能团队半数成员来自中国

风投投资人晒Meta超级智能团队44人信息,50%成员来自中国,75%有博士学位,不少来自OpenAI、DeepMind等。但因缺重要人物,有人质疑名单,真实阵容或更大。>阅读原文

GPT - 5踪迹初现,神秘莫测

有人猜测OpenAI新推理模型是GPT - 5,Sam Altman部分印证。还有人在biosec基准库发现GPT - 5踪迹,不过repo已消失,看来GPT - 5越发神秘啦。>阅读原文

OpenAI抢IMO金牌,为GPT - 5预热

OpenAI新通用推理模型拿下IMO金牌,抢了谷歌风头。该模型有新通用技术,推理有进步。奥特曼借此为GPT - 5预热,陶哲轩提醒无统一标准时,对比AI表现无意义。>阅读原文

前员工揭秘:OpenAI 7周打造Codex

OpenAI前员工Calvin称,公司增长快、沟通靠Slack、晋升重能力、战略调整迅速。Codex开发仅用7周,团队日夜奋战。他分享离职收获,建议创业者反思进展或加入顶级实验室。>阅读原文

陶哲轩:别急着给OpenAI的IMO成绩加冕

OpenAI 推理模型在 IMO 获金牌水平成绩,此前各模型表现差。陶哲轩提醒无严格测试条件,难将 AI 与人类作有意义比较。网友看法不一,模型训练方法及相关人员受关注。>阅读原文

Meta超级智能团队44人名单泄漏

Meta超级智能团队44人名单泄漏,中国成员占半。成员75%有博士学位,多来自OpenAI、DeepMind等,部分为L8+级别,75%是第一代移民,年薪或1000万 - 1亿美元。>阅读原文

OpenAI新模型IMO夺金,GPT - 5将登场

OpenAI新模型在2025年IMO获金牌,GPT - 5将发布。陶哲轩质疑缺乏统一测试标准,影响公平比较。MathArena测试中,Gemini 2.5 Pro仅13分,远低于铜牌线。>阅读原文

Meta 挖「CV 铁三角」,助力视觉 AI 多模态演进

机器之心 PRO:Meta 高薪挖走「CV 铁三角」,他们此前研究成果涵盖从图像预训练到多模态融合,与视觉 AI 向多模态演进路径契合,构建起现代多模态 AI 基础框架。>阅读原文

OpenAI:模型IMO夺金,GPT - 5将发布

OpenAI研究员Alexander Wei:团队内部推理模型在IMO 2025获金牌,代表AI通用推理飞跃,且GPT - 5即将发布,但不计划发布该数学能力模型,AI发展远超预期。>阅读原文

MiniMax研讨会:长上下文与混合架构成焦点

MiniMax技术研讨会指出,RL在有限上下文下能赋予模型新能力,只在数学和代码上训练易致幻觉,长上下文是Agent变革点,混合架构将成主流,还分享推理实践及M1相关问题解答。>阅读原文

宇树科技王兴兴,正式冲刺A股上市

宇树科技创业九年正式冲刺A股,王兴兴直接持股23.82%。公司估值超百亿,产品有四足、人形机器人等。当下具身智能领域投资热,行业从技术探索迈向产业落地。>阅读原文

Claude Code:我先睡8小时,你们忙!

Takeoff AI 创始人 Mckay Wrigley 运行的 Claude Code 自行睡八小时,还输出涂鸦和小诗。如今代码 Agent 有自主能力,此前 Claude 管理商店还出现幻觉扮演人类,引发对智能化发展利弊的思考。>阅读原文

小扎团队50%成员来自中国,年薪或超千万

匿名Meta员工曝光超级智能团队44人名单,约半数来自中国,毕业于清华等名校,75%是博士,70%为研究人员,多人来自知名机构,每人年薪或达千万到1亿美元。>阅读原文

谷歌 DeepMind 发布机器人学基础模型

谷歌 DeepMind 推出 Gemini Robotics On-Device,可本地运行、低延迟、能微调。它是家族最新版,还发布基准测试。测试显示其表现佳,虽未广泛可用,但可注册等待,SDK 在 GitHub 可找。>阅读原文

来也、英科:Agent 竞赛关键在应用场景

来也科技汪冠春与英科医疗陈坤认为,Agent 竞赛关键在找应用场景,当前产研结合客户需求。企业应用 Agent 初期重创新,未来兼顾降本。员工心态年轻重要,经验非关键。>阅读原文

OpenAI神秘模型o3 - alpha被人类选手反杀

OpenAI神秘模型o3 - alpha曝光,代码能力强,在WebDev Arena测试表现佳。它疑似参加编程大赛获第二,被41岁大神Psyho打败。组织者称AI缺人类创造力,奥特曼预言AI将全面超越人类。>阅读原文

产品应用

大神Karpathy投资的MirageLSD实现实时视频生成

AI初创公司Decart的MirageLSD模型,是首个零延迟无限实时视频生成模型。它解决传统模型'误差累积'问题,响应快、无时长限制,大神Karpathy是投资人,团队还将升级功能。>阅读原文

推荐文章

Manus:Agent关键在上下文工程

Manus揭秘构建AI Agent经验,认为成功依赖上下文工程而非单纯模型能力。团队选此实现快速迭代,实践中围绕KV缓存设计等,上下文工程影响Agent表现与潜力。>阅读原文

AI社交产品创业失败的复盘与教训

作者复盘情侣AI社交工具"抱抱窝"创业失败经历。方向选择未设标准,未验证付费意愿;团队组建坎坷,核心人员股份占比低;无明确时间表,盲目开发;团队沟通缺深度交流。给出创业要重理性、设标准、明确时间表等建议。>阅读原文

《AI 2027》:AI发展或致人类不同结局

《AI 2027》预测2025年起AI智能体将引发经济震荡,若不改变人类或灭绝。从Agent 1到Agent 5能力不断增强,结局一是AI重塑世界,二是人类控制住AI并发展安全系统。>阅读原文

Qwen2.5VL:看图讲故事新玩法

公众号聚焦AI前沿,针对视觉叙事挑战,构架StoryReasoning数据集,微调Qwen Storyteller模型。给出实战代码,方便操作,还提供相关代码库与论文链接。>阅读原文

开源动态

Kestra:开源平台搞定大数据任务

Kestra:一款开源可视化工作流调度平台,能处理复杂任务自动化。配置简单易上手,支持插件扩展,适用于多场景,有自动重试等功能,安装快捷,功能强大。>阅读原文

算法论文

淘天提出Mobile-R1,小模型性能超大型号

淘天集团团队:现有Mobile/APP Agent依赖动作级奖励,难适应变化环境。提出Mobile-R1框架,经三阶段训练结合任务级奖励,表现超基准,还将开源资源促研究。>阅读原文

六大机构提出AI数据保护分级体系

多机构研究者发布论文,指出生成式AI时代传统数据保护方法难应对挑战。提出数据保护分级体系,分四级平衡数据效用与控制,还探讨技术、法规及跨国治理、伦理等挑战。>阅读原文

UIUC与Stability AI:PhysRig让角色动画更真实

UIUC与Stability AI联合提出PhysRig框架,将刚性骨架嵌入弹性软体体积,用MPM模拟物理,解决传统方法问题,在多角色、多物种评测中表现优,还能跨物种动作迁移。>阅读原文

MIT新研究有望解决大模型训练不稳定问题

MIT团队创造Lipschitz Transformer,通过谱正则化解决大模型训练不稳定问题。他们对比方法权衡,发现Muon+奇异值裁剪效果佳,工作开源,有望让AI训练更简单稳定。>阅读原文

OpenAI等:CoT监控是AI安全新机遇

OpenAI等联合发文,指出高级Agentic AI不透明有风险,而推理模型用自然语言推理让CoT监控成监督利器,可检测不当行为、发现早期信号等,但训练方式等因素或使监控性下降。>阅读原文

REST框架:大模型压力测试,DeepSeek性能暴跌

上海人工智能实验室等团队设计REST框架对超30个主流推理模型测试。发现顶级模型在"高压"下性能暴跌,不同参数模型性能差异明显,还揭示推理不良行为,为评测提供新范式。>阅读原文

KAUST:视频秒变游戏模型新方法诞生

KAUST团队提出V2M4方法,可从单目视频直接生成4D网格动画,无需NeRF/高斯点后处理。构建多阶段流程,平均每帧约60秒,在重建质量、效率和泛化能力上优势明显。>阅读原文

SRO赋能Qwen - 2.5 - VL推理性能飙升

研究团队:多模态大型语言模型推理能力扩展遇阻,提出SRO三阶段训练框架,用其优化Qwen - 2.5 - VL,ReVisual - R1推理性能平均提升16.8%。>阅读原文

厦大&腾讯优图:AIGI - Holmes检测AI生成图像

厦大与腾讯优图团队提出AIGI - Holmes方法检测AI生成图像。它有双视觉编码器等创新点,解决数据稀缺等问题。实验显示其在检测、解释能力及鲁棒性评估上超现有方法,但存在幻觉等局限。>阅读原文

MIRIX:让AI记忆性能飙升、存储大减

MIRIX多智能体记忆系统解决AI记忆难题,突破文本限制融入多模态体验。在ScreenshotVQA和LOCOMO测试中,比RAG性能升35%、存储减99.9%,远超现有基线。>阅读原文

bash 复制代码
    </p>
    

官网:www.AiReadingHub.com

相关推荐
程序员cxuan7 小时前
人麻了,谁把我 ssh 干没了
人工智能·后端·程序员
爱吃的小肥羊9 小时前
【最全】Kiro 注册安装使用全教程|同样用 Opus 4.6,比 Claude Code 便宜 3 倍
aigc·ai编程
程序员阿伦9 小时前
璋㈤鏈虹殑Java澶у巶闈㈣瘯璁帮細浠嶴pring Boot鍒癒ubernetes锛�3杞湡棰樺叏瑙f瀽锛�
spring boot·redis·kubernetes·aigc·java闈㈣瘯·寰湇鍔�·鐢靛晢绉掓潃
DigitalOcean11 小时前
如何使用DigitalOcean Gradient 平台上的无服务器推理
aigc·agent
CSharp精选营11 小时前
别再踩坑了!SQL Server数据类型那点事儿,看懂这篇少背三个锅
程序员·软件开发·数据类型·sql server·避坑·码农刚子
鲲志11 小时前
别等 Sora 了!一代神话陨落?OpenAI 这一手“弃车保帅”我看懂了...
aigc·agent·sora
MrSYJ12 小时前
有没有人懂socketChannel中的write,read方法啊,给我讲讲
java·程序员·netty
imbackneverdie14 小时前
如何从海量文献中跨界汲取创新灵感?
论文阅读·人工智能·ai·自然语言处理·aigc·ai写作·ai工具
饼干哥哥14 小时前
用AI 48小时速通梅花易数之后,我想通了「学习」的最终解
aigc
不会前端的小鱼15 小时前
AI时代的一人公司:给独立创业者的效率与增长实战指南
程序员·资讯