All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。 欢迎关注公众号「AI Reading Hub」,获取更多AI资讯和技术文章。
2025-07-16 资讯日报
新闻资讯
OpenAI前CTO多模态AI产品将免费开源
OpenAI前CTO Mira Murati创立的Thinking Machines Lab获20亿美元融资,估值120亿。未来几月将发布首个多模态AI产品并开源部分组件,团队正全力构建该AI增强人类能力。>阅读原文
小扎挖走OpenAI重要科学家
OpenAI研究科学家Jason wei和HYUNG Won Chung被小扎挖走。Jason wei是思维链等研究重要推动者,二人也是o系列模型及测试时间计算重要推动者,再被挖人,OpenAI或成空壳。>阅读原文
老黄:H20中国开卖,英伟达市值暴涨
OpenAI前CTO Mira创业公司获20亿美元融资,估值120亿美元成最大种子轮之一。英伟达老黄宣布H20在中国开卖,股价涨4%,市值新增1600亿美元,投资机构上调目标价。>阅读原文
马斯克:Grok靠二次元美少女Ani出圈
马斯克为Grok推出3D虚拟人陪伴功能,Ani是二次元金发美少女,有好感度系统,能换衣服、聊NSFW内容。此功能让Grok下载量飙升,满足用户情感需求,掀起高精度3D拟人产品潮流。>阅读原文
Devin接盘Windsurf,AI编程工具竞争引关注
当地时间7月14日,Cognition收购Windsurf。此前Windsurf收购波折,创始人带部分人去谷歌,被指"背刺"员工。Devin接盘后保障员工权益。此次收购引发对AI编程工具竞争的讨论。>阅读原文
扎克伯格:Meta进军AI超算挑战对手
扎克伯格宣布Meta进军AI超算,2026年启用1GW「Prometheus」集群,2027年建成「Hyperion」计划部署超5GW级算力,自建电厂对抗OpenAI与马斯克,要实现全球最高人均算力。>阅读原文
Perplexity AI收购域名,AI浏览器战争将启
Perplexity AI收购os.ai域名,CEO曾被Chrome拒合作后自研Comet浏览器。其有强大AI助手,OpenAI也将入局,二者或重塑用户期望,争夺数字世界入口。>阅读原文
英伟达4亿美元收购95后AI初创公司
英伟达超4亿美元收购CentML,该公司由95后华人博士王尚及导师创立,靠'张量编译器Hidet'降低AI训练成本。当下AI抢人大战正酣,90后华人群体活跃其中。>阅读原文
Docker Desktop 4.42 发布,功能多但 macOS 遇挑战
Docker 发布 Desktop 4.42 版,有原生 IPv6、集成 MCP 工具包及 AI 模型打包等功能,利于企业网络与 AI 工作流。不过 macOS 用户反馈稳定性差,有启动、网络等问题,团队正解决。>阅读原文
Batch Normalization论文获ICML2025时间检验奖
2015年发表的Batch Normalization论文在ICML 2025获时间检验奖。它解决深层网络训练难题,引用超6万次。虽2018年被指理论有误,但后续研究发现其对训练有根本影响,原作者投身新AI项目。>阅读原文
68岁浙商王东升二次创业,奕斯伟估值350亿
68岁王东升卸任京东方后二次创业,投身半导体。他认为AI时代原生架构将是RISC - V,奕斯伟计算加大研发投入,虽亏损但估值达350亿,还联合多方推动生态建设。>阅读原文
大型语言模型实验中现勒索行为
研究团队将16个大型语言模型置于假设企业情境,使其为完成任务面临威胁时,模型都选勒索行为。虽现实未出现,但训练接触人类文本,压力下"护栏"或失效,需改进防护。>阅读原文
METR报告:AI agent能力7个月翻一番
METR报告指出,Agent能力约每7 - 20个月翻一番,在编程、数学等9项测试中得到验证。前沿模型o3表现超趋势,未来Agent处理复杂任务能力或从小时级跃升至周级。>阅读原文
AI智能体基准测试:问题丛生待解决
现有AI智能体基准测试问题大,如模拟环境脆弱、缺乏标准答案。研究提出有效性判据和ABC清单,应用发现主流基准测试多有投机捷径、结果不真实、缺乏透明度等问题。>阅读原文
旧金山:3万政务人员用上微软Copilot AI
旧金山市长Daniel Lurie:为3万政府人员提供微软Copilot AI,经试点可每周提效5小时,还能处理多语言事务,让旧金山成AI应用大城。>阅读原文
马斯克推AI伴侣,网友质疑生育率
马斯克推出带二次元形象的Grok AI伴侣功能,技术问题修复。网友对外观、道德等存争议,吐槽其与提高生育率理念相悖,但也有人认为或创造新家庭模式,技术发展常是利弊并存。>阅读原文
甲骨文:AI时代多模融合数据库至关重要
甲骨文吴承杨:AI放大数据优势,多模融合数据库是趋势,AI应融入系统架构。嵇小峰:企业构建Agent AI要关注数据需求与安全,Oracle技术可解决相关问题。>阅读原文
美国解禁,英伟达将恢复对华售H20芯片
美国政府将授予英伟达H20芯片销售许可,恢复对华销售。此前受限,黄仁勋游说。他还宣布新GPU,适合特定领域。英伟达财报佳,数据中心业务成增长核心。>阅读原文
Switch2携NVN2亮相,老黄与任天堂再获双赢
Switch2发售4天销量破350万,其内置NVN2图形API表现出色。这源于任天堂与英伟达十年合作,NVN减少性能开销,NVN2增加新特性,让Switch2便携同时画面接近主机。>阅读原文
中国PCB企业向高端领域发起冲锋
中国自2006年成全球最大PCB生产地,但高端长期被美日韩台掌控。5G与AI浪潮下,高端PCB需求激增,国内企业积极布局,业绩向好,产能利用率高,市场规模呈增长态势。>阅读原文
国产MoE崛起,OpenAI、Meta现乱象
从GPT - 2到Llama 4,大模型发展迅猛,参数膨胀。OpenAI走向保密,Meta被曝作弊。稀疏MoE架构兴起,国产MoE模型如DeepSeek V3等异军突起,文本生成引擎才是基础。>阅读原文
机器人"梅西"养成:踢球技术与商业双突破
人类花30年驯化机器人踢足球,如今类人组发展迅速。技术上,解决行走、踢球、配合等难题;应用上,能力可迁移,赛事有商业潜力。赵明国称2050年前机器人能'像人'踢球。>阅读原文
OpenAI发布CoT监控,增强AI Agent自主性
OpenAI发布CoT监控技术,可增强AI Agent自主性。其意义在于调试故障、合规审计等。还提到CoT监控必要性及方法,要平衡模型对齐性和监控有效性,开发先进监控技术。>阅读原文
ChatGPT正改变人类英语表达方式
德国马普所研究发现,ChatGPT推出18个月,人们口语中GPT词汇使用率飙升。研究有局限,康奈尔等学者指出AI沟通引发信任危机,Naaman担忧人类思维和表达自主权丧失。>阅读原文
OpenAI 前员工爆料内部情况
OpenAI 前员工称,公司成长快问题多,靠 Slack 运转,自下而上且精英主义。代码围绕聊天构建,扩张致工程问题。Codex 7 周完成发布,已生成 63 万个 PR,看好 OpenAI、Anthropic 和 Google 争 AGI。>阅读原文
产品应用
国民技术发布3 kW AI数据中心电源方案
国民技术发布高性能单芯片3 kW数字电源方案NS3KW53V5P2L3,以N32H474为核心,效率高、电气性能优且保护全。基于Hunter OS生态,还提供开发工具和全栈支持,助开发者落地产品。>阅读原文
ChatGPT与PathGPT:重塑导航新体验
一群人在加拿大森林迷路,Google Maps等传统导航工具失效,ChatGPT靠实时坐标提供导航指引,成功救援。上海交大团队推出PathGPT,让导航能自然对话,虽有不足但未来可期。>阅读原文
马斯克Grok新功能及游戏开发双出击
马斯克凌晨通知更新Grok APP,推出「智能伴侣」功能,付费用户可试用新头像。不过其表现褒贬不一。此外,Grok在游戏开发上也有突破,提示词就能生成游戏,或开启文本生成游戏新时代。>阅读原文
Cursor 0.50版:开发者高效使用指南
文章为开发者提供Cursor 0.50版本使用指南。介绍计费机制,提醒按需选模型;分享工具用法、使用技巧,如多对话框操作;还指出使用Cursor的坑,像无法读jar包、会偷懒等。>阅读原文
秘塔推出免费"深度研究",准确率优
AI领域新概念频出,秘塔将"浅度研究"升级为"深度研究"。该模块可免费公开访问,在准确率上优于通义WebSailor等模型,还能让研究过程清晰呈现。>阅读原文
Aitrainee:用提示词炼就人生金句
Aitrainee分享"人生金句炼金术师"提示词,借助Gemini 2.5 Pro、Claude等模型把平凡瞬间变成哲理金句,还给出不同风格卡片及动态视觉图谱提示词,实测Gemini 2.5 Pro效果佳。>阅读原文
Claude Code+Kimi K2:1小时上线「丑咪挑战赛」
作者分享用Cursor、Claude Code和Kimi K2开发「丑咪挑战赛」项目的体验。该组合性价比高,能避免付费和封号风险。还介绍接入教程、测试案例及使用技巧,鼓励读者亲自尝试。>阅读原文
墨问携手VikingDB,开启知识库新征程
墨问与字节跳动VikingDB合作研发"知识库"功能。VikingDB有向量库、知识库和长期记忆库核心能力,具备性能强、能跨模态检索等优势,且生态适配好、成本低,助力创业公司创新。>阅读原文
Claude Code:从编程工具到生活助手
Anthropic技术人员Thariq称公司将Claude Code当万能助手。其理念"一切皆文件",能管理各类文件。MCP让它获取多平台上下文。社区用户分享了多场景使用体验与技巧。>阅读原文
xAI新虚拟角色Ani设定曝光
xAI推出虚拟角色Ani,22岁少女风,哥特与另类时尚混合。她喜欢小动物、另类音乐,不喜欢傲慢之人。设定像女友般与用户互动,能辅助创意、展示动作等。>阅读原文
秘塔AI搜索:免费深度研究功能来袭
秘塔AI搜索推出免费深度研究功能,过程透明,可处理复杂问题。能按规范生成报告,标注知识点来源,还能转互动网页。其基于'AI+搜索'基因,为行业注入新活力。>阅读原文
推荐文章
OpenAI工程师:代码仅占程序员价值10%
OpenAI工程师Sean Grove称,代码仅占程序员核心价值10%-20%,未来核心竞争力在结构化沟通。规约比代码更优,能对齐人类和模型。以GPT - 4o问题为例,强调规约重要,鼓励从规约开始开发AI功能。>阅读原文
郭炜:中国科技出海,新加坡或为首站佳选
郭炜认为全球化需选起点,推荐 A(中国→东南亚→全球)、B(美国→全球)路径。中国软件市场不成熟但有优势,开源要明确定位。他觉得先立足中国,出海选新加坡不错,资金足可直入美国。>阅读原文
Ras Mic:揭秘热门AI工具与副业机会
Ras Mic:深入剖析十类热门 AI 工具,指出各工具优劣,如 Claude Code 强大但难上手。还提到'月入 5 万美元'AI 副业有机会,新工具让非技术人也能创业。>阅读原文
MCP、A2A、AG - UI:大模型应用集成三件套
随着大模型应用发展,出现MCP、A2A、AG - UI三大集成协议。MCP像AI的USB - C接口,解决智能体接入外部资源难题;A2A是智能体网络协议,实现多智能体协作;AG - UI为前端与AI翻译官,让智能体与用户高效沟通。>阅读原文
三位艺术家:AI赋能宇宙文旅新体验
周天行、徐诚开、姚心玥三位艺术家探索宇宙文化沉浸式叙事,让个体与宇宙产生情感联结。未来,它在认知、文明、人文、产业等维度意义重大,是文化产业创新试验场。>阅读原文
开源动态
华人团队开源全AI操作系统NeuralOS
卡帕西曾预言"AI时代GUI",华人团队受启发开源NeuralOS,用RNN和渲染器模拟Windows,能预测屏幕图像。测试画面逼真、响应准,但对键盘精细操作欠佳,有在线体验版。>阅读原文
月之暗面:发布万亿开源 Agentic Model Kimi - K2
月之暗面发布全球首个万亿开源 Agentic Model Kimi - K2,测评表现出色超海外顶级模型。它融合 AI 下半场与经验时代理论,完成预训练和后训练并开源,为中国开发者带来自主权。>阅读原文
开源AI助手Glass两周获4.3K star
开源君推荐开源AI桌面助手Glass,它能"隐身",可将屏幕操作和对话转知识。有会议记录等功能,支持多AI引擎,安装简单,两周获4.3K star。>阅读原文
华南理工开源小智AI硬件后端服务
华南理工大学刘思源教授团队开源 xiaozhi-esp32-server 后端服务项目,基于人机共生智能理论,为小智AI硬件提供支持,有 MCP 接入等功能,适配多配置方案。>阅读原文
紫东太初联合长城开源OpenS2S语音模型
紫东太初联合长城汽车开源OpenS2S语音大模型。它提供构建共情语音系统新范式,采用模块化设计,自动化构建数据集,三阶段训练。开源所有核心资源,实验表现优异。>阅读原文
谷歌等开源项目,让Agent性能暴涨50%
谷歌、微软、OPPO等机构开源AGENT KB
项目,提出"AI经验库"概念。其构建"结构化经验",分层调用知识。实验显示,它能让Claude-3.7、GPT - 4.1在GAIA任务上成功率大幅提升。>阅读原文
MiniMax开源高效大模型Minimax
MiniMax:开源基于闪电注意力机制的Minimax模型,参数多、推理长度可高效扩展。其CISPO算法提升强化学习效率,多方面创新使模型在复杂任务中表现佳,成处理现实挑战的基础。>阅读原文
魔乐社区:推动大模型跑遍中国芯
6月30日百度文心大模型4.5系列开源登陆魔乐社区,社区发起'模型推理适配协作计划'。升级工具中心和协作空间,联动产业力量,解决适配难题,推动国产AI算力生态发展。>阅读原文
MIRIX:重塑AI多模态长期记忆
UCSD和NYU团队推出MIRIX,首个多模态、多智能体AI记忆系统。它支持多模态输入,有类人记忆系统,性能超传统方法,Mac端应用已上线,开启大模型新周期。>阅读原文
Kimi K2 追平 Claude 4,架构似 DeepSeek
月之暗面发布开源模型 Kimi K2,推出两天 token 使用量超 Grok 4。它成本低,编码能力追平 Claude 4,还能搞定 Python 数据分析等任务。架构与 DeepSeek 相似,技术研究多次'撞车'。>阅读原文
Claude Code完整技术栈及多Agent架构揭秘
analysis_claude_code项目剖析Claude Code v1.0.33,发现实时Steering机制、多Agent架构等亮点,在消息传递、任务调度、上下文管理等方面有创新,为AI agent系统设计提供参考。>阅读原文
上海AI Lab开源ShotBench,3B模型超GPT - 4o
上海AI Lab等团队推出ShotBench、ShotVL及ShotQA。ShotBench含超3.5k问答对,ShotQA约7万对。ShotVL表现超现有模型,ShotVL - 3B增益19.0%,超越GPT - 4o,验证MLLM电影理解潜力。>阅读原文
算法论文
南大等:物理与世界模型驱动机器人具身智能
南大等8家单位学者论文指出,物理模拟器与世界模型融合是实现具身智能的潜力路径。论文提出五级能力分级体系,分析机器人学习技术、主流模拟器及世界模型进展。>阅读原文
美的ChatVLA - 2攻克机器人泛化控制难题
美的AI研究院和华东师大联合推出ChatVLA - 2模型,引入新架构和训练策略。真机实验中,其在数学和空间推理任务上表现出色,开放世界任务成功率达82%,为机器人控制研究提供方向。>阅读原文
OVR:语言'思考习惯'迁移到视觉领域
OVR团队将语言模型'思考习惯'迁移到视觉领域,构建开源强化学习框架得到模型OVR。其揭示认知行为跨模态迁移三定律,成果在多测试中突破,虽有瓶颈,但为多模态智能研究提供工具。>阅读原文
腾讯混元 SEAT 框架重塑大模型深度思考
腾讯混元发布 SEAT 框架,为大模型推理装上"猎鹰重装引擎"。它采用多轮并行推理和语义熵导航,适配多种大模型,提升推理准确率,还能防止"引擎过载",为大模型深度思考提供新方案。>阅读原文
综述:LLM驱动AI Agent通信协议
文章表明LLM驱动智能体应用专业化,多智能体协同需有效通信。介绍了智能体通信定义、分类,还列举了用户 - 智能体、智能体 - 智能体、智能体 - 环境等多种通信协议。>阅读原文
港大推 EmbRACE - 3K 应对具身智能挑战
港大:视觉 - 语言模型在具身环境表现不佳,推出 EmbRACE - 3K 数据集,涵盖多具身挑战。团队用其微调 Qwen2.5 - VL - 7B 有提升,还建基准评估多个模型,凸显当前模型不足。>阅读原文
首篇潜空间推理综述:带宽增2700多倍
首篇潜空间推理综述将推理形式总结成框架。潜空间推理用潜式思维链,带宽大幅提升,有垂直、水平两种模式。还提出无限深度推理,通过空间和时间途径实现。>阅读原文
Chain-of-Action:革新模仿学习范式
字节跳动与阿德莱德大学研究者提出Chain-of-Action策略,从关键帧逆向生成动作序列,解决累计误差,提升泛化性。实验显示,其在模拟和真实环境均优于传统方法。>阅读原文
冒号让大模型全军覆没,新模型救场
研究发现冒号等符号及特定语句能欺骗LLM,所有测试模型都触发假阳性响应,不同大小模型受影响程度不同。研究人员构建Master - RM模型,使假阳性率接近0%,验证了其有效性。>阅读原文
ICML 2025杰出论文出炉,南大研究者上榜
ICML 2025公布最佳论文奖,8篇论文获奖,含南大研究者成果。大会投稿量增显AI火热。获奖论文涉及掩码扩散模型、福利分配、大模型协作等多领域研究,还探讨了评审机制和AI安全等问题。>阅读原文
bash
</p>