AI Daily | AI日报：微信支付 MCP，开启“对话即交易”时代; 镁伽科技：机器人独角兽冲刺IPO; 北大团队突破存算一体排序难题

All in AI，看见未来。每天精选最值得读的AI文章，帮你筛掉时代的噪音。以简讯见广度，以深读见洞察。技术、趋势、思考，一站式掌握AI世界。欢迎关注公众号「AI Reading Hub」，获取更多AI资讯和技术文章。

2025-07-09 资讯日报

新闻资讯

微信支付 MCP，开启"对话即交易"时代

作者认为未来公共大模型或接入 MCP 消解 App 壁垒。没想到微信支付先 mcp 了，用户在腾讯元器体验，支付后智能体干活。它实现"对话即交易"，但要解决安全合规问题。>阅读原文

镁伽科技：机器人独角兽冲刺IPO

百亿机器人独角兽镁伽科技冲刺港股IPO。它是细分赛道收入第一的自主智能体供应商，面向生命科学和制造行业。虽仍亏损但业绩向好，获博世、高盛等巨头和资本支持。>阅读原文

北大团队突破存算一体排序难题

AI浪潮下半导体产业需创新，存算一体技术受关注，但排序难题制约其发展。北大团队国际首次实现高效排序硬件架构，提升排序速度与能效，适用于各类AI场景，具经济与战略意义。>阅读原文

Boaz Klartag跨界破解百年球体堆积难题

数学家Boaz Klartag用被弃的罗杰斯"椭球体起始"方法，解决高维空间球体堆积难题，使堆积数量大幅增加，为无线通信领域提供新思路，也引发对最优堆积方法的讨论。>阅读原文

清北AI天团血洗硅谷，OpenAI被逼分股权

清北中科等名校毕业生在硅谷成超级明星，Meta挖人致谷歌涨薪、OpenAI送1/3股权。AI人才薪资差距大，全球顶尖人才仅几百人，国内AI人才需求和高薪职位增长快。>阅读原文

OpenRouter 7月模型排名：谷歌领先，DeepSeek超Anthropic

OpenRouter：7月模型排名中，谷歌模型令牌份额占比43.2%领先，DeepSeek超Anthropic，编程领域Claude sonnet 4占比第一，谷歌Gemini 2.5pro进步显著。>阅读原文

Shlomo：AI创业6个月赚5.7亿

Shlomo：AI降低创业门槛，我用Claude和Gemini打造Base44，采用"全栈原生"理念突围。独立创业有挑战，但小团队靠AI也能胜出。以"任务"定位产品，靠"公开构建"和"积分"实现增长。>阅读原文

从RT - 2到FiS - VLA，VLA引领机器人进化

2025年具身智能赛道火热，VLA模型成焦点。从谷歌RT - 2到中国FiS - VLA，技术不断进化。中国智平方等企业表现出色，FiS - VLA解决传统问题，性能领先，VLA将在多领域发光。>阅读原文

OpenAI反击：挖走Meta、马斯克旗下4人

被挖8人后，OpenAI反击。4人将加入，含Meta华裔科学家及马斯克旗下公司3人。两名华人加入Scaling团队，OpenAI要加速使命让AI惠及数亿人。>阅读原文

AI上清北，人类教育与价值何去何从？

极客公园张鹏、「乱翻书」潘乱、甲子光年张一甲对谈。AI高考成绩跃升，在推理、多模态能力提升明显，但在数学研究、文科创作等方面与人有差距。人类应关注自我，让AI辅助学习，教育要平衡应试与自我发展。>阅读原文

谢赛宁：AI论文隐藏指令风波引反思

谢赛宁合著论文被指用隐藏指令诱导AI打高分，他紧急回应，承认因未细审文件有责任。解释是学生误解推文所致，已采取补救。他认为应探讨AI时代科研伦理，解决AI审稿矛盾。>阅读原文

Pokee.ai：RL 打造 AI Agent 获 1200 万美元融资

华人创业团队 Pokee.ai 创始人朱哲清称，团队以 RL 为核心开发 AI Agent，已完成 1200 万美元种子轮融资，产品公测版上线。他认为通用 Agent 应按需自动完成任务，当前行业先得解决问题，再探索理解用户意图。>阅读原文

国内首部AI大模型私有化部署标准征集起草者

智合标准中心组织起草国内首部AI大模型私有化部署标准。当前企业私有化部署痛点多，此标准全流程覆盖、多方面融合、三方协作，能解决问题，现正征集起草单位和个人。>阅读原文

纽约时报：AI冲击谁的就业引争议

在科技公司裁员潮下，专家热议AI对就业的冲击。部分人觉得职场新人易被取代，另一些人认为资深员工更危险。不同研究结果有别，部分公司已减少招聘初级或资深员工。>阅读原文

Cloudflare发布Containers公开测试版

Cloudflare发布Containers服务公开测试版，可在全球网络运行容器，与Workers集成，能处理资源密集型应用。虽有功能待完善，如全球自动扩展等，但已获积极反馈，后续还会增加通信方式。>阅读原文

AI陪伴硬件：主体性至上，破同质化竞争

AGI Playground 2025大会上，创业者何嘉斌、张晓辉等探讨AI陪伴硬件。认为产品应重主体性，避免说话破坏角色感；同质化竞争不实际，情感纽带具不可替代性；还谈及寿命、功能迭代等问题。>阅读原文

ChatGPT测试"Study Together"新功能

ChatGPT测试"Study Together"新功能，或更多向用户提问，类似回应谷歌LearnLM，还可能支持多人学习小组模式，有望减少其在教育领域被滥用为"作弊工具"的情况。>阅读原文

CREE转型碳化硅失败，最终申请破产重整

成立近40年的CREE（后更名Wolfspeed）曾因碳化硅受关注，转型后却走向破产。扩产8英寸产能与车企需求错配，中国企业6英寸产能扩张，加上电动车增速放缓，使其市场份额被挤占，最终破产重整。>阅读原文

稚晖君公司21亿拿下科创板公司控股权

稚晖君联合创办的智元机器人，出资至少21亿完成对A股科创板上纬新材63.62%控股权收购。智元创办不到3年，融资数十亿、估值破百亿，此举不走IPO却通向公开资本市场。>阅读原文

汪渊携7亿估值AI公司再创业

前饿了么联合创始人汪渊再创业，其AI公司Orion Arm获融资。旗下两款产品，Syft AI可过滤新闻重复内容，Toki AI能语音管理日程，目标三年内两款产品用户达1亿。>阅读原文

产品应用

Proactor AI：首个自主行动的AI队友

Proactor AI v1.0发布，它无需提示主动行动，能识别骗局，提供实时转录、自动任务识别等主动式服务，应用于工作、销售等多场景，用户认为其或改变生产力工作流程。>阅读原文

Meta：Aria智能眼镜开启AI新可能

Meta公布Aria第二代智能眼镜，体积小、续航6 - 8小时，内置多传感器。研究人员今年晚些时候可获取，其数据或为增强现实、机器人技术等开辟新路径，还计划建大量数据中心。>阅读原文

vivo：多模态大模型千卡集群训练优化实践

vivo AI 架构师王兆雄：多模态大模型训练面临算力、存储等挑战。从数据处理、模型计算、通信、稳定性四方面优化，如 LLaVA 数据加载耗时缩至 10%，DiT 训练时长减半，未来 AI Infra 将在多维度升级。>阅读原文

钉钉机器人+OOS AI助手实现运维自由

传统运维受设备和场景限制，阿里云OOS AI助手与钉钉机器人结合，可免登录、跨设备秒级响应。如张伟深夜在家用其10分钟解决故障，还说明了使用及配置步骤，为业务稳定护航。>阅读原文

Extend AI：解锁企业PDF非结构化数据宝藏

硅谷工程师创立Extend AI，获1700万融资，拿下多家企业客户。该产品解决传统文档处理的局限，通过多模态大语言模型等技术，打造平台，实现高准确率，目标成"文档处理云"。>阅读原文

腾讯上新艺术级3D生成模型Hunyuan3D - PolyGen

腾讯上新艺术级3D生成模型Hunyuan3D - PolyGen，能把线稿变复杂3D模型，鹅厂游戏工作室用后美术师建模效率提升超70%。采用自回归框架等技术，解决复杂建模和稳定性问题。>阅读原文

开源动态

北大开源S2V新基建OpenS2V - Nexus

北大团队：推出OpenS2V - Nexus开源套件，含评测基准与百万级数据集，解决S2V领域缺乏数据和评测问题，还揭示主流模型在泛化、自然度和一致性上的不足。>阅读原文

22岁开发者Scira项目用户破6万

22岁孟买开发者Zaid Mukaddam开发开源项目Scira，功能多且有优势，虽遇成本难题，但获Groq等支持。此外，还有TinyWow、Only Finders等个人开发者项目也取得成功。>阅读原文

Google开源MCP工具连接数据库超轻松

Google开源genai - toolbox，它是数据库MCP服务器，能简化数据库工具集成到AI应用的过程。支持主流数据库，提供多语言SDK和多种部署方式，内置企业级特性。项目地址：github.com/googleapis/... - toolbox 。>阅读原文

Hugging Face开源最强3B模型SmolLM3

Hugging Face开源SmolLM3，参数30亿却性能超同类。有128k上下文、支持6种语言和双推理模式，架构等全开放，联合创始人推荐，称适合开源研究。>阅读原文

蚂蚁等发布 KAG-Thinker 支持复杂推理

蚂蚁集团等发布 KAG-Thinker 模型，为复杂推理构建结构化思考范式。实验表明，它在多数据集上性能超多个基线模型，还在医疗领域展现优势，但 7B 模型拆分复杂问题能力待提升。>阅读原文

阿里HumanOmniV2突破全模态AI理解边界

阿里巴巴通义实验室团队：推出HumanOmniV2，以Qwen2.5-Omni-Thinker为基础改进GRPO训练方法，构建新推理范式、数据集与基准，在多基准测试中性能领先，推动多模态AI发展。>阅读原文

张文涛团队：推出DataFlow解决AI数据难题

张文涛和鄂维南院士团队推出DataFlow系统，解决学术界大模型数据难题。它有100余个算子、8条流水线，支持文本模态，处理后数据能提升大模型性能，多模态版正在开发。>阅读原文

阿里开源WebSailor，挑战OpenAI闭源霸权

阿里通义开源WebSailor模型挑战闭源霸权。此前开源Agent因训练数据难度低表现不佳，WebSailor通过构造L3合成数据、优化训练轨迹、采用两步走训练策略，提升了模型在复杂任务中的性能。>阅读原文

Agent框架三大协议：MCP、A2A、AG-UI解析

文章介绍Agent框架三大协议。MCP由Anthropic开源，获三大巨头支持，让工具"即插即用"；A2A促进Agent协作，但MAS不成熟未普及；AG-UI由CopilotKit团队发起，解决Agent与前端交互标准化问题。>阅读原文

Polaris：4B模型数学推理超Claude 4

港大、字节Seed、复旦联合发布Polaris强化学习配方，让4B模型数学推理超商业大模型，可在消费级显卡部署且已开源。其成功秘籍是围绕待训练模型配置，还解决了数据、温度、长文本训练等问题。>阅读原文

算法论文

刘野等：DragSolver快速估汽车风阻系数

宁波东方理工大学刘野、陈云天等提出DragSolver模型用于汽车风阻系数估计。它解决了多尺度耦合等五大挑战，在多数据集测试中达最优，可降本增效，还有跨领域应用潜力。>阅读原文

阿里通义：HumanOmniV2攻克多模态推理难题

阿里通义针对多模态推理的两大问题推出HumanOmniV2改进方案。训练分冷启动、两阶段强化学习，经数据准备、模型选择等步骤，还给出数据集下载和训练方法链接。>阅读原文

清华等提出医学基准MedXpertQA评测模型

清华、上海AI Lab学者：现有医学基准有缺陷，推出MedXpertQA。它难度高、临床相关性强，构建严格。评测显示前沿模型在医学领域提升空间大，凸显推理子集重要性。>阅读原文

NCAL：用神经坍缩破解学习长尾难题

华东师范大学和浙江大学团队在ICML2025提出NCAL方法，将神经坍缩理论引入个性化学习领域。它解决教育数据长尾分布问题，在多模型表现卓越，为智能教育转变提供动力。>阅读原文

杜克大学等：三招锁定 LLM 推理关键句子

杜克大学等研究者指出长思维链中部分步骤更关键，提出黑盒、白盒、因果归因三方法锁定'命门句子'，还提供开源工具，案例研究展示了方法实用性与互补性。>阅读原文

StreamDiT：单卡每秒16帧实时生成视频

加利福尼亚大学与Meta联合提出StreamDiT模型，采用流匹配等方法，训练40亿参数模型，蒸馏后单卡每秒16帧实时生成512p视频，可实时交互，但有伪影问题。>阅读原文

英伟达等提出Fast - dLLM加速扩散模型

英伟达、港大、麻省理工研究人员：提出Fast - dLLM解决扩散语言模型推理难题。用近似KV缓存减少计算，基于置信度平行解码。测试表明能大幅加速，且生成质量波动小。>阅读原文

字节&NTU：多模态模型按需搜索更准

字节与NTU的MMSearch - R1项目探索多模态模型搜索策略。通过集成工具、强化学习训练和构建数据集，使模型按需搜索。实验表明，该模型少搜30%还更准，为多模态大模型发展奠基。>阅读原文

循环模型500步后训练突破256k长度泛化极限

CMU、Cartesia AI研究者指出，循环模型处理长序列时遇未探索状态致泛化失败。提出未探索状态假说，用SP、TBTT等干预方法，经500步后训练，让模型突破256k长度泛化极限。>阅读原文

MIT SEAL：自适应模型超GPT - 4.1

麻省理工学院推出SEAL框架，让大模型自我生成数据和指令适应新任务。实验中，其合成数据微调效果超GPT - 4.1，在少样本学习和知识整合任务上，比基线方法表现更好。>阅读原文

清华&NTU：两张图重构3D空间新范式

清华&NTU团队的LangScene-X以生成式框架，仅用2张图就能构建3D语言嵌入场景。它解决传统方法痛点，单模型统合多模态，在多数据集上表现优异，为空间智能带来新范式。>阅读原文

bash 复制代码

    </p>

官网：www.AiReadingHub.com