All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。 欢迎关注公众号「AI Reading Hub」,获取更多AI资讯和技术文章。
2025-07-09 资讯日报
新闻资讯
微信支付 MCP,开启"对话即交易"时代
作者认为未来公共大模型或接入 MCP 消解 App 壁垒。没想到微信支付先 mcp 了,用户在腾讯元器体验,支付后智能体干活。它实现"对话即交易",但要解决安全合规问题。>阅读原文
镁伽科技:机器人独角兽冲刺IPO
百亿机器人独角兽镁伽科技冲刺港股IPO。它是细分赛道收入第一的自主智能体供应商,面向生命科学和制造行业。虽仍亏损但业绩向好,获博世、高盛等巨头和资本支持。>阅读原文
北大团队突破存算一体排序难题
AI浪潮下半导体产业需创新,存算一体技术受关注,但排序难题制约其发展。北大团队国际首次实现高效排序硬件架构,提升排序速度与能效,适用于各类AI场景,具经济与战略意义。>阅读原文
Boaz Klartag跨界破解百年球体堆积难题
数学家Boaz Klartag用被弃的罗杰斯"椭球体起始"方法,解决高维空间球体堆积难题,使堆积数量大幅增加,为无线通信领域提供新思路,也引发对最优堆积方法的讨论。>阅读原文
清北AI天团血洗硅谷,OpenAI被逼分股权
清北中科等名校毕业生在硅谷成超级明星,Meta挖人致谷歌涨薪、OpenAI送1/3股权。AI人才薪资差距大,全球顶尖人才仅几百人,国内AI人才需求和高薪职位增长快。>阅读原文
OpenRouter 7月模型排名:谷歌领先,DeepSeek超Anthropic
OpenRouter:7月模型排名中,谷歌模型令牌份额占比43.2%领先,DeepSeek超Anthropic,编程领域Claude sonnet 4占比第一,谷歌Gemini 2.5pro进步显著。>阅读原文
Shlomo:AI创业6个月赚5.7亿
Shlomo:AI降低创业门槛,我用Claude和Gemini打造Base44,采用"全栈原生"理念突围。独立创业有挑战,但小团队靠AI也能胜出。以"任务"定位产品,靠"公开构建"和"积分"实现增长。>阅读原文
从RT - 2到FiS - VLA,VLA引领机器人进化
2025年具身智能赛道火热,VLA模型成焦点。从谷歌RT - 2到中国FiS - VLA,技术不断进化。中国智平方等企业表现出色,FiS - VLA解决传统问题,性能领先,VLA将在多领域发光。>阅读原文
OpenAI反击:挖走Meta、马斯克旗下4人
被挖8人后,OpenAI反击。4人将加入,含Meta华裔科学家及马斯克旗下公司3人。两名华人加入Scaling团队,OpenAI要加速使命让AI惠及数亿人。>阅读原文
AI上清北,人类教育与价值何去何从?
极客公园张鹏、「乱翻书」潘乱、甲子光年张一甲对谈。AI高考成绩跃升,在推理、多模态能力提升明显,但在数学研究、文科创作等方面与人有差距。人类应关注自我,让AI辅助学习,教育要平衡应试与自我发展。>阅读原文
谢赛宁:AI论文隐藏指令风波引反思
谢赛宁合著论文被指用隐藏指令诱导AI打高分,他紧急回应,承认因未细审文件有责任。解释是学生误解推文所致,已采取补救。他认为应探讨AI时代科研伦理,解决AI审稿矛盾。>阅读原文
Pokee.ai:RL 打造 AI Agent 获 1200 万美元融资
华人创业团队 Pokee.ai 创始人朱哲清称,团队以 RL 为核心开发 AI Agent,已完成 1200 万美元种子轮融资,产品公测版上线。他认为通用 Agent 应按需自动完成任务,当前行业先得解决问题,再探索理解用户意图。>阅读原文
国内首部AI大模型私有化部署标准征集起草者
智合标准中心组织起草国内首部AI大模型私有化部署标准。当前企业私有化部署痛点多,此标准全流程覆盖、多方面融合、三方协作,能解决问题,现正征集起草单位和个人。>阅读原文
纽约时报:AI冲击谁的就业引争议
在科技公司裁员潮下,专家热议AI对就业的冲击。部分人觉得职场新人易被取代,另一些人认为资深员工更危险。不同研究结果有别,部分公司已减少招聘初级或资深员工。>阅读原文
Cloudflare发布Containers公开测试版
Cloudflare发布Containers服务公开测试版,可在全球网络运行容器,与Workers集成,能处理资源密集型应用。虽有功能待完善,如全球自动扩展等,但已获积极反馈,后续还会增加通信方式。>阅读原文
AI陪伴硬件:主体性至上,破同质化竞争
AGI Playground 2025大会上,创业者何嘉斌、张晓辉等探讨AI陪伴硬件。认为产品应重主体性,避免说话破坏角色感;同质化竞争不实际,情感纽带具不可替代性;还谈及寿命、功能迭代等问题。>阅读原文
ChatGPT测试"Study Together"新功能
ChatGPT测试"Study Together"新功能,或更多向用户提问,类似回应谷歌LearnLM,还可能支持多人学习小组模式,有望减少其在教育领域被滥用为"作弊工具"的情况。>阅读原文
CREE转型碳化硅失败,最终申请破产重整
成立近40年的CREE(后更名Wolfspeed)曾因碳化硅受关注,转型后却走向破产。扩产8英寸产能与车企需求错配,中国企业6英寸产能扩张,加上电动车增速放缓,使其市场份额被挤占,最终破产重整。>阅读原文
稚晖君公司21亿拿下科创板公司控股权
稚晖君联合创办的智元机器人,出资至少21亿完成对A股科创板上纬新材63.62%控股权收购。智元创办不到3年,融资数十亿、估值破百亿,此举不走IPO却通向公开资本市场。>阅读原文
汪渊携7亿估值AI公司再创业
前饿了么联合创始人汪渊再创业,其AI公司Orion Arm获融资。旗下两款产品,Syft AI可过滤新闻重复内容,Toki AI能语音管理日程,目标三年内两款产品用户达1亿。>阅读原文
产品应用
Proactor AI:首个自主行动的AI队友
Proactor AI v1.0发布,它无需提示主动行动,能识别骗局,提供实时转录、自动任务识别等主动式服务,应用于工作、销售等多场景,用户认为其或改变生产力工作流程。>阅读原文
Meta:Aria智能眼镜开启AI新可能
Meta公布Aria第二代智能眼镜,体积小、续航6 - 8小时,内置多传感器。研究人员今年晚些时候可获取,其数据或为增强现实、机器人技术等开辟新路径,还计划建大量数据中心。>阅读原文
vivo:多模态大模型千卡集群训练优化实践
vivo AI 架构师王兆雄:多模态大模型训练面临算力、存储等挑战。从数据处理、模型计算、通信、稳定性四方面优化,如 LLaVA 数据加载耗时缩至 10%,DiT 训练时长减半,未来 AI Infra 将在多维度升级。>阅读原文
钉钉机器人+OOS AI助手实现运维自由
传统运维受设备和场景限制,阿里云OOS AI助手与钉钉机器人结合,可免登录、跨设备秒级响应。如张伟深夜在家用其10分钟解决故障,还说明了使用及配置步骤,为业务稳定护航。>阅读原文
Extend AI:解锁企业PDF非结构化数据宝藏
硅谷工程师创立Extend AI,获1700万融资,拿下多家企业客户。该产品解决传统文档处理的局限,通过多模态大语言模型等技术,打造平台,实现高准确率,目标成"文档处理云"。>阅读原文
腾讯上新艺术级3D生成模型Hunyuan3D - PolyGen
腾讯上新艺术级3D生成模型Hunyuan3D - PolyGen,能把线稿变复杂3D模型,鹅厂游戏工作室用后美术师建模效率提升超70%。采用自回归框架等技术,解决复杂建模和稳定性问题。>阅读原文
推荐文章
腾讯程序员揭秘GPU工作原理与编程模式
腾讯程序员binnnliu:介绍GPU从图形渲染到GPGPU的演进,阐述CPU/GPU异构架构,对比性能发现GPU计算快但通讯开销大。还讲解编译、启动过程,以及硬件架构、编程模型,提及SIMT隐藏SIMD细节。>阅读原文
陈士骏:AI创业需试错与关注核心指标
YouTube 联创陈士骏与 Manus 团队交流。他认为创业要关注核心指标,如视频上传和用户注册数;用先发优势留住用户,靠提供附加价值;硅谷鼓励试错,很多头部产品是一路调整起来的。>阅读原文
开源动态
北大开源S2V新基建OpenS2V - Nexus
北大团队:推出OpenS2V - Nexus开源套件,含评测基准与百万级数据集,解决S2V领域缺乏数据和评测问题,还揭示主流模型在泛化、自然度和一致性上的不足。>阅读原文
22岁开发者Scira项目用户破6万
22岁孟买开发者Zaid Mukaddam开发开源项目Scira,功能多且有优势,虽遇成本难题,但获Groq等支持。此外,还有TinyWow、Only Finders等个人开发者项目也取得成功。>阅读原文
Google开源MCP工具连接数据库超轻松
Google开源genai - toolbox,它是数据库MCP服务器,能简化数据库工具集成到AI应用的过程。支持主流数据库,提供多语言SDK和多种部署方式,内置企业级特性。项目地址:github.com/googleapis/... - toolbox 。>阅读原文
Hugging Face开源最强3B模型SmolLM3
Hugging Face开源SmolLM3,参数30亿却性能超同类。有128k上下文、支持6种语言和双推理模式,架构等全开放,联合创始人推荐,称适合开源研究。>阅读原文
蚂蚁等发布 KAG-Thinker 支持复杂推理
蚂蚁集团等发布 KAG-Thinker 模型,为复杂推理构建结构化思考范式。实验表明,它在多数据集上性能超多个基线模型,还在医疗领域展现优势,但 7B 模型拆分复杂问题能力待提升。>阅读原文
阿里HumanOmniV2突破全模态AI理解边界
阿里巴巴通义实验室团队:推出HumanOmniV2,以Qwen2.5-Omni-Thinker为基础改进GRPO训练方法,构建新推理范式、数据集与基准,在多基准测试中性能领先,推动多模态AI发展。>阅读原文
张文涛团队:推出DataFlow解决AI数据难题
张文涛和鄂维南院士团队推出DataFlow系统,解决学术界大模型数据难题。它有100余个算子、8条流水线,支持文本模态,处理后数据能提升大模型性能,多模态版正在开发。>阅读原文
阿里开源WebSailor,挑战OpenAI闭源霸权
阿里通义开源WebSailor模型挑战闭源霸权。此前开源Agent因训练数据难度低表现不佳,WebSailor通过构造L3合成数据、优化训练轨迹、采用两步走训练策略,提升了模型在复杂任务中的性能。>阅读原文
Agent框架三大协议:MCP、A2A、AG-UI解析
文章介绍Agent框架三大协议。MCP由Anthropic开源,获三大巨头支持,让工具"即插即用";A2A促进Agent协作,但MAS不成熟未普及;AG-UI由CopilotKit团队发起,解决Agent与前端交互标准化问题。>阅读原文
Polaris:4B模型数学推理超Claude 4
港大、字节Seed、复旦联合发布Polaris强化学习配方,让4B模型数学推理超商业大模型,可在消费级显卡部署且已开源。其成功秘籍是围绕待训练模型配置,还解决了数据、温度、长文本训练等问题。>阅读原文
算法论文
刘野等:DragSolver快速估汽车风阻系数
宁波东方理工大学刘野、陈云天等提出DragSolver模型用于汽车风阻系数估计。它解决了多尺度耦合等五大挑战,在多数据集测试中达最优,可降本增效,还有跨领域应用潜力。>阅读原文
阿里通义:HumanOmniV2攻克多模态推理难题
阿里通义针对多模态推理的两大问题推出HumanOmniV2改进方案。训练分冷启动、两阶段强化学习,经数据准备、模型选择等步骤,还给出数据集下载和训练方法链接。>阅读原文
清华等提出医学基准MedXpertQA评测模型
清华、上海AI Lab学者:现有医学基准有缺陷,推出MedXpertQA。它难度高、临床相关性强,构建严格。评测显示前沿模型在医学领域提升空间大,凸显推理子集重要性。>阅读原文
NCAL:用神经坍缩破解学习长尾难题
华东师范大学和浙江大学团队在ICML2025提出NCAL方法,将神经坍缩理论引入个性化学习领域。它解决教育数据长尾分布问题,在多模型表现卓越,为智能教育转变提供动力。>阅读原文
杜克大学等:三招锁定 LLM 推理关键句子
杜克大学等研究者指出长思维链中部分步骤更关键,提出黑盒、白盒、因果归因三方法锁定'命门句子',还提供开源工具,案例研究展示了方法实用性与互补性。>阅读原文
StreamDiT:单卡每秒16帧实时生成视频
加利福尼亚大学与Meta联合提出StreamDiT模型,采用流匹配等方法,训练40亿参数模型,蒸馏后单卡每秒16帧实时生成512p视频,可实时交互,但有伪影问题。>阅读原文
英伟达等提出Fast - dLLM加速扩散模型
英伟达、港大、麻省理工研究人员:提出Fast - dLLM解决扩散语言模型推理难题。用近似KV缓存减少计算,基于置信度平行解码。测试表明能大幅加速,且生成质量波动小。>阅读原文
字节&NTU:多模态模型按需搜索更准
字节与NTU的MMSearch - R1项目探索多模态模型搜索策略。通过集成工具、强化学习训练和构建数据集,使模型按需搜索。实验表明,该模型少搜30%还更准,为多模态大模型发展奠基。>阅读原文
循环模型500步后训练突破256k长度泛化极限
CMU、Cartesia AI研究者指出,循环模型处理长序列时遇未探索状态致泛化失败。提出未探索状态假说,用SP、TBTT等干预方法,经500步后训练,让模型突破256k长度泛化极限。>阅读原文
MIT SEAL:自适应模型超GPT - 4.1
麻省理工学院推出SEAL框架,让大模型自我生成数据和指令适应新任务。实验中,其合成数据微调效果超GPT - 4.1,在少样本学习和知识整合任务上,比基线方法表现更好。>阅读原文
清华&NTU:两张图重构3D空间新范式
清华&NTU团队的LangScene-X以生成式框架,仅用2张图就能构建3D语言嵌入场景。它解决传统方法痛点,单模型统合多模态,在多数据集上表现优异,为空间智能带来新范式。>阅读原文
bash
</p>