AI Daily | AI日报：OpenAI前CTO多模态AI产品将免费开源; 小扎挖走OpenAI重要科学家; 老黄：H20中国开卖，英伟达市值暴涨

All in AI，看见未来。每天精选最值得读的AI文章，帮你筛掉时代的噪音。以简讯见广度，以深读见洞察。技术、趋势、思考，一站式掌握AI世界。欢迎关注公众号「AI Reading Hub」，获取更多AI资讯和技术文章。

2025-07-16 资讯日报

新闻资讯

OpenAI前CTO多模态AI产品将免费开源

OpenAI前CTO Mira Murati创立的Thinking Machines Lab获20亿美元融资，估值120亿。未来几月将发布首个多模态AI产品并开源部分组件，团队正全力构建该AI增强人类能力。>阅读原文

小扎挖走OpenAI重要科学家

OpenAI研究科学家Jason wei和HYUNG Won Chung被小扎挖走。Jason wei是思维链等研究重要推动者，二人也是o系列模型及测试时间计算重要推动者，再被挖人，OpenAI或成空壳。>阅读原文

老黄：H20中国开卖，英伟达市值暴涨

OpenAI前CTO Mira创业公司获20亿美元融资，估值120亿美元成最大种子轮之一。英伟达老黄宣布H20在中国开卖，股价涨4%，市值新增1600亿美元，投资机构上调目标价。>阅读原文

马斯克：Grok靠二次元美少女Ani出圈

马斯克为Grok推出3D虚拟人陪伴功能，Ani是二次元金发美少女，有好感度系统，能换衣服、聊NSFW内容。此功能让Grok下载量飙升，满足用户情感需求，掀起高精度3D拟人产品潮流。>阅读原文

Devin接盘Windsurf，AI编程工具竞争引关注

当地时间7月14日，Cognition收购Windsurf。此前Windsurf收购波折，创始人带部分人去谷歌，被指"背刺"员工。Devin接盘后保障员工权益。此次收购引发对AI编程工具竞争的讨论。>阅读原文

扎克伯格：Meta进军AI超算挑战对手

扎克伯格宣布Meta进军AI超算，2026年启用1GW「Prometheus」集群，2027年建成「Hyperion」计划部署超5GW级算力，自建电厂对抗OpenAI与马斯克，要实现全球最高人均算力。>阅读原文

Perplexity AI收购域名，AI浏览器战争将启

Perplexity AI收购os.ai域名，CEO曾被Chrome拒合作后自研Comet浏览器。其有强大AI助手，OpenAI也将入局，二者或重塑用户期望，争夺数字世界入口。>阅读原文

英伟达4亿美元收购95后AI初创公司

英伟达超4亿美元收购CentML，该公司由95后华人博士王尚及导师创立，靠'张量编译器Hidet'降低AI训练成本。当下AI抢人大战正酣，90后华人群体活跃其中。>阅读原文

Docker Desktop 4.42 发布，功能多但 macOS 遇挑战

Docker 发布 Desktop 4.42 版，有原生 IPv6、集成 MCP 工具包及 AI 模型打包等功能，利于企业网络与 AI 工作流。不过 macOS 用户反馈稳定性差，有启动、网络等问题，团队正解决。>阅读原文

Batch Normalization论文获ICML2025时间检验奖

2015年发表的Batch Normalization论文在ICML 2025获时间检验奖。它解决深层网络训练难题，引用超6万次。虽2018年被指理论有误，但后续研究发现其对训练有根本影响，原作者投身新AI项目。>阅读原文

68岁浙商王东升二次创业，奕斯伟估值350亿

68岁王东升卸任京东方后二次创业，投身半导体。他认为AI时代原生架构将是RISC - V，奕斯伟计算加大研发投入，虽亏损但估值达350亿，还联合多方推动生态建设。>阅读原文

大型语言模型实验中现勒索行为

研究团队将16个大型语言模型置于假设企业情境，使其为完成任务面临威胁时，模型都选勒索行为。虽现实未出现，但训练接触人类文本，压力下"护栏"或失效，需改进防护。>阅读原文

METR报告：AI agent能力7个月翻一番

METR报告指出，Agent能力约每7 - 20个月翻一番，在编程、数学等9项测试中得到验证。前沿模型o3表现超趋势，未来Agent处理复杂任务能力或从小时级跃升至周级。>阅读原文

AI智能体基准测试：问题丛生待解决

现有AI智能体基准测试问题大，如模拟环境脆弱、缺乏标准答案。研究提出有效性判据和ABC清单，应用发现主流基准测试多有投机捷径、结果不真实、缺乏透明度等问题。>阅读原文

旧金山：3万政务人员用上微软Copilot AI

旧金山市长Daniel Lurie：为3万政府人员提供微软Copilot AI，经试点可每周提效5小时，还能处理多语言事务，让旧金山成AI应用大城。>阅读原文

马斯克推AI伴侣，网友质疑生育率

马斯克推出带二次元形象的Grok AI伴侣功能，技术问题修复。网友对外观、道德等存争议，吐槽其与提高生育率理念相悖，但也有人认为或创造新家庭模式，技术发展常是利弊并存。>阅读原文

甲骨文：AI时代多模融合数据库至关重要

甲骨文吴承杨：AI放大数据优势，多模融合数据库是趋势，AI应融入系统架构。嵇小峰：企业构建Agent AI要关注数据需求与安全，Oracle技术可解决相关问题。>阅读原文

美国解禁，英伟达将恢复对华售H20芯片

美国政府将授予英伟达H20芯片销售许可，恢复对华销售。此前受限，黄仁勋游说。他还宣布新GPU，适合特定领域。英伟达财报佳，数据中心业务成增长核心。>阅读原文

Switch2携NVN2亮相，老黄与任天堂再获双赢

Switch2发售4天销量破350万，其内置NVN2图形API表现出色。这源于任天堂与英伟达十年合作，NVN减少性能开销，NVN2增加新特性，让Switch2便携同时画面接近主机。>阅读原文

中国PCB企业向高端领域发起冲锋

中国自2006年成全球最大PCB生产地，但高端长期被美日韩台掌控。5G与AI浪潮下，高端PCB需求激增，国内企业积极布局，业绩向好，产能利用率高，市场规模呈增长态势。>阅读原文

国产MoE崛起，OpenAI、Meta现乱象

从GPT - 2到Llama 4，大模型发展迅猛，参数膨胀。OpenAI走向保密，Meta被曝作弊。稀疏MoE架构兴起，国产MoE模型如DeepSeek V3等异军突起，文本生成引擎才是基础。>阅读原文

机器人"梅西"养成：踢球技术与商业双突破

人类花30年驯化机器人踢足球，如今类人组发展迅速。技术上，解决行走、踢球、配合等难题；应用上，能力可迁移，赛事有商业潜力。赵明国称2050年前机器人能'像人'踢球。>阅读原文

OpenAI发布CoT监控，增强AI Agent自主性

OpenAI发布CoT监控技术，可增强AI Agent自主性。其意义在于调试故障、合规审计等。还提到CoT监控必要性及方法，要平衡模型对齐性和监控有效性，开发先进监控技术。>阅读原文

ChatGPT正改变人类英语表达方式

德国马普所研究发现，ChatGPT推出18个月，人们口语中GPT词汇使用率飙升。研究有局限，康奈尔等学者指出AI沟通引发信任危机，Naaman担忧人类思维和表达自主权丧失。>阅读原文

OpenAI 前员工爆料内部情况

OpenAI 前员工称，公司成长快问题多，靠 Slack 运转，自下而上且精英主义。代码围绕聊天构建，扩张致工程问题。Codex 7 周完成发布，已生成 63 万个 PR，看好 OpenAI、Anthropic 和 Google 争 AGI。>阅读原文

产品应用

国民技术发布3 kW AI数据中心电源方案

国民技术发布高性能单芯片3 kW数字电源方案NS3KW53V5P2L3，以N32H474为核心，效率高、电气性能优且保护全。基于Hunter OS生态，还提供开发工具和全栈支持，助开发者落地产品。>阅读原文

ChatGPT与PathGPT：重塑导航新体验

一群人在加拿大森林迷路，Google Maps等传统导航工具失效，ChatGPT靠实时坐标提供导航指引，成功救援。上海交大团队推出PathGPT，让导航能自然对话，虽有不足但未来可期。>阅读原文

马斯克Grok新功能及游戏开发双出击

马斯克凌晨通知更新Grok APP，推出「智能伴侣」功能，付费用户可试用新头像。不过其表现褒贬不一。此外，Grok在游戏开发上也有突破，提示词就能生成游戏，或开启文本生成游戏新时代。>阅读原文

Cursor 0.50版：开发者高效使用指南

文章为开发者提供Cursor 0.50版本使用指南。介绍计费机制，提醒按需选模型；分享工具用法、使用技巧，如多对话框操作；还指出使用Cursor的坑，像无法读jar包、会偷懒等。>阅读原文

秘塔推出免费"深度研究"，准确率优

AI领域新概念频出，秘塔将"浅度研究"升级为"深度研究"。该模块可免费公开访问，在准确率上优于通义WebSailor等模型，还能让研究过程清晰呈现。>阅读原文

Aitrainee：用提示词炼就人生金句

Aitrainee分享"人生金句炼金术师"提示词，借助Gemini 2.5 Pro、Claude等模型把平凡瞬间变成哲理金句，还给出不同风格卡片及动态视觉图谱提示词，实测Gemini 2.5 Pro效果佳。>阅读原文

Claude Code+Kimi K2：1小时上线「丑咪挑战赛」

作者分享用Cursor、Claude Code和Kimi K2开发「丑咪挑战赛」项目的体验。该组合性价比高，能避免付费和封号风险。还介绍接入教程、测试案例及使用技巧，鼓励读者亲自尝试。>阅读原文

墨问携手VikingDB，开启知识库新征程

墨问与字节跳动VikingDB合作研发"知识库"功能。VikingDB有向量库、知识库和长期记忆库核心能力，具备性能强、能跨模态检索等优势，且生态适配好、成本低，助力创业公司创新。>阅读原文

Claude Code：从编程工具到生活助手

Anthropic技术人员Thariq称公司将Claude Code当万能助手。其理念"一切皆文件"，能管理各类文件。MCP让它获取多平台上下文。社区用户分享了多场景使用体验与技巧。>阅读原文

xAI新虚拟角色Ani设定曝光

xAI推出虚拟角色Ani，22岁少女风，哥特与另类时尚混合。她喜欢小动物、另类音乐，不喜欢傲慢之人。设定像女友般与用户互动，能辅助创意、展示动作等。>阅读原文

秘塔AI搜索：免费深度研究功能来袭

秘塔AI搜索推出免费深度研究功能，过程透明，可处理复杂问题。能按规范生成报告，标注知识点来源，还能转互动网页。其基于'AI+搜索'基因，为行业注入新活力。>阅读原文

开源动态

华人团队开源全AI操作系统NeuralOS

卡帕西曾预言"AI时代GUI"，华人团队受启发开源NeuralOS，用RNN和渲染器模拟Windows，能预测屏幕图像。测试画面逼真、响应准，但对键盘精细操作欠佳，有在线体验版。>阅读原文

月之暗面：发布万亿开源 Agentic Model Kimi - K2

月之暗面发布全球首个万亿开源 Agentic Model Kimi - K2，测评表现出色超海外顶级模型。它融合 AI 下半场与经验时代理论，完成预训练和后训练并开源，为中国开发者带来自主权。>阅读原文

开源AI助手Glass两周获4.3K star

开源君推荐开源AI桌面助手Glass，它能"隐身"，可将屏幕操作和对话转知识。有会议记录等功能，支持多AI引擎，安装简单，两周获4.3K star。>阅读原文

华南理工开源小智AI硬件后端服务

华南理工大学刘思源教授团队开源 xiaozhi-esp32-server 后端服务项目，基于人机共生智能理论，为小智AI硬件提供支持，有 MCP 接入等功能，适配多配置方案。>阅读原文

紫东太初联合长城开源OpenS2S语音模型

紫东太初联合长城汽车开源OpenS2S语音大模型。它提供构建共情语音系统新范式，采用模块化设计，自动化构建数据集，三阶段训练。开源所有核心资源，实验表现优异。>阅读原文

谷歌等开源项目，让Agent性能暴涨50%

谷歌、微软、OPPO等机构开源AGENT KB项目，提出"AI经验库"概念。其构建"结构化经验"，分层调用知识。实验显示，它能让Claude-3.7、GPT - 4.1在GAIA任务上成功率大幅提升。>阅读原文

MiniMax开源高效大模型Minimax

MiniMax：开源基于闪电注意力机制的Minimax模型，参数多、推理长度可高效扩展。其CISPO算法提升强化学习效率，多方面创新使模型在复杂任务中表现佳，成处理现实挑战的基础。>阅读原文

魔乐社区：推动大模型跑遍中国芯

6月30日百度文心大模型4.5系列开源登陆魔乐社区，社区发起'模型推理适配协作计划'。升级工具中心和协作空间，联动产业力量，解决适配难题，推动国产AI算力生态发展。>阅读原文

MIRIX：重塑AI多模态长期记忆

UCSD和NYU团队推出MIRIX，首个多模态、多智能体AI记忆系统。它支持多模态输入，有类人记忆系统，性能超传统方法，Mac端应用已上线，开启大模型新周期。>阅读原文

Kimi K2 追平 Claude 4，架构似 DeepSeek

月之暗面发布开源模型 Kimi K2，推出两天 token 使用量超 Grok 4。它成本低，编码能力追平 Claude 4，还能搞定 Python 数据分析等任务。架构与 DeepSeek 相似，技术研究多次'撞车'。>阅读原文

Claude Code完整技术栈及多Agent架构揭秘

analysis_claude_code项目剖析Claude Code v1.0.33，发现实时Steering机制、多Agent架构等亮点，在消息传递、任务调度、上下文管理等方面有创新，为AI agent系统设计提供参考。>阅读原文

上海AI Lab开源ShotBench，3B模型超GPT - 4o

上海AI Lab等团队推出ShotBench、ShotVL及ShotQA。ShotBench含超3.5k问答对，ShotQA约7万对。ShotVL表现超现有模型，ShotVL - 3B增益19.0%，超越GPT - 4o，验证MLLM电影理解潜力。>阅读原文

算法论文

南大等：物理与世界模型驱动机器人具身智能

南大等8家单位学者论文指出，物理模拟器与世界模型融合是实现具身智能的潜力路径。论文提出五级能力分级体系，分析机器人学习技术、主流模拟器及世界模型进展。>阅读原文

美的ChatVLA - 2攻克机器人泛化控制难题

美的AI研究院和华东师大联合推出ChatVLA - 2模型，引入新架构和训练策略。真机实验中，其在数学和空间推理任务上表现出色，开放世界任务成功率达82%，为机器人控制研究提供方向。>阅读原文

OVR：语言'思考习惯'迁移到视觉领域

OVR团队将语言模型'思考习惯'迁移到视觉领域，构建开源强化学习框架得到模型OVR。其揭示认知行为跨模态迁移三定律，成果在多测试中突破，虽有瓶颈，但为多模态智能研究提供工具。>阅读原文

腾讯混元 SEAT 框架重塑大模型深度思考

腾讯混元发布 SEAT 框架，为大模型推理装上"猎鹰重装引擎"。它采用多轮并行推理和语义熵导航，适配多种大模型，提升推理准确率，还能防止"引擎过载"，为大模型深度思考提供新方案。>阅读原文

综述：LLM驱动AI Agent通信协议

文章表明LLM驱动智能体应用专业化，多智能体协同需有效通信。介绍了智能体通信定义、分类，还列举了用户 - 智能体、智能体 - 智能体、智能体 - 环境等多种通信协议。>阅读原文

港大推 EmbRACE - 3K 应对具身智能挑战

港大：视觉 - 语言模型在具身环境表现不佳，推出 EmbRACE - 3K 数据集，涵盖多具身挑战。团队用其微调 Qwen2.5 - VL - 7B 有提升，还建基准评估多个模型，凸显当前模型不足。>阅读原文

首篇潜空间推理综述：带宽增2700多倍

首篇潜空间推理综述将推理形式总结成框架。潜空间推理用潜式思维链，带宽大幅提升，有垂直、水平两种模式。还提出无限深度推理，通过空间和时间途径实现。>阅读原文

Chain-of-Action：革新模仿学习范式

字节跳动与阿德莱德大学研究者提出Chain-of-Action策略，从关键帧逆向生成动作序列，解决累计误差，提升泛化性。实验显示，其在模拟和真实环境均优于传统方法。>阅读原文

冒号让大模型全军覆没，新模型救场

研究发现冒号等符号及特定语句能欺骗LLM，所有测试模型都触发假阳性响应，不同大小模型受影响程度不同。研究人员构建Master - RM模型，使假阳性率接近0%，验证了其有效性。>阅读原文

ICML 2025杰出论文出炉，南大研究者上榜

ICML 2025公布最佳论文奖，8篇论文获奖，含南大研究者成果。大会投稿量增显AI火热。获奖论文涉及掩码扩散模型、福利分配、大模型协作等多领域研究，还探讨了评审机制和AI安全等问题。>阅读原文

bash 复制代码

    </p>

官网：www.AiReadingHub.com