All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。 欢迎关注公众号「AI Reading Hub」,获取更多AI资讯和技术文章。
2025-07-18 资讯日报
新闻资讯
AWS:破解Agentic AI落地难题
红杉美国合伙人预测2025年为AI agent元年,但Agentic AI落地难。AWS发布系列产品,如支持长时间运行负载的Amazon Bedrock AgentCore等,还升级存储与市场服务,或成企业构建选择。>阅读原文
谷歌MoR架构:或成Transformer杀手
谷歌推出Mixture-of-Recursions(MoR)架构,在单一框架实现参数共享与自适应计算统一。实验显示,其性能超Transformer,计算效率高、可扩展性强,网友猜测或改变AI规则。>阅读原文
米哈游5亿成立新公司,AI布局野心大
米哈游动作不断,5亿成立无定谷科技。其早涉足AI,有自研模型,创始人蔡浩宇创业成果《Whispers from the Star》试玩。还与马斯克的AI女友Ani互动,两款产品方向不同。>阅读原文
OpenAI发布ChatGPT Agent,Agent创业者慌了
OpenAI发布ChatGPT Agent,整合多种能力,支持网页浏览、代码运行等。新模型经强化训练,在多基准测试中表现超竞品和旧版。这或使初创公司转向垂类Agent赛道。>阅读原文
苹果MLX框架主动适配英伟达CUDA
苹果为扩大影响力,让MLX框架适配CUDA。因CUDA在AI开发占主导,生态强,开发者多,且不允许在非英伟达平台运行程序,苹果此举既合规,又能借势发展。>阅读原文
特朗普宣布900亿建宾夕法尼亚AI中心
特朗普:宣布超900亿美元投资,要将宾夕法尼亚州打造成美国AI核心。谷歌、黑石等积极参与,涉及数据中心、能源基建等项目,还强调"能源安全人工智能"理念,将创造大量工作岗位。>阅读原文
OpenAI发布ChatGPT Agent,创业赛道生变
OpenAI发布ChatGPT Agent,将思考与执行能力整合,工作生活场景皆适用。它优化后能力达SOTA,不过也有风险。这或重塑互联网,让Agent创业者重新审视自身竞争力。>阅读原文
黄仁勋:中国AI与电动汽车令人惊叹
黄仁勋认为中国供应链先进、AI发展快,H20芯片解禁后将满足需求。他称赞中国电动汽车,尊重对手,不担忧贸易限制。他鼓励年轻人投身AI,还分享多AI比对提问的方法。>阅读原文
Claude Code主创回归,Anthropic估值冲千亿
Claude Code主创跳槽后回归Anthropic。该公司正洽谈新一轮融资,目标估值1000亿美元。Claude Code表现出色,收入增长快,还将推分析仪表盘,Cursor收入增长也让Anthropic受益。>阅读原文
OpenAI推出ChatGPT Agent,能力升级但有风险
OpenAI发布ChatGPT Agent,实现通用智能体能力升级,可完成复杂任务,已向部分用户开放。它整合多能力、配工具,基准测试表现好。不过有安全风险,网友体验有亮点也指出待改进处。>阅读原文
OpenAI发布ChatGPT Agent,或为GPT-5前菜
OpenAI发布ChatGPT Agent,能完成多类任务,如生活、办公等。测试表现不错,但离人类能力有差距。它是GPT - 5前菜,从提示式转向委托式协作,重新定义人机交互,不过也有安全风险。>阅读原文
Mistral AI:Le Chat对标ChatGPT穷追不舍
欧洲AI初创公司Mistral AI很躁动,连发多个开源模型。还升级Le Chat,功能全对标ChatGPT。其语音模型Voxtral号称最佳,多方面超竞品,展现欧洲在大模型领域的追赶势头。>阅读原文
Lovable 融资 2 亿,Beehiiv 年收破 3000 万
Lovable 完成 2 亿美金 A 轮融资,活跃用户 230 万,ARR 近 9000 万美金。每月 10 万家创业公司在此成立。Beehiiv 年营收破 3000 万美金,创始人分享 20 条创业心得,如顾问用处不大等。>阅读原文
Meta重金抢人,难复制DeepSeek成功
Meta 扎克伯格重金招人,组建豪华 AI 战队。但组织天才协同才是关键,DeepSeek 团队小、扁平化却成功逆袭。Meta 组织惯性大,难复制其成功,AI 行业组织重构能力或更重要。>阅读原文
OpenAI发布ChatGPT Agent,智能体赛道生变
OpenAI发布ChatGPT Agent,可自主思考选工具完成复杂任务。CEO Sam Altman称其能力强但有风险,内置安全机制。测试成绩优异,网友期待体验,认为或推动生产力革命。>阅读原文
OpenAI前员工深度反思公司内外情况
OpenAI前员工:在极速扩张下,公司沟通、管理等面临挑战,文化独特,技术受Meta影响。Codex项目7周完成发布,成果显著。认为AGI竞赛在OpenAI、Anthropic和Google间展开。>阅读原文
人类选手Psycho击败OpenAI获编程冠军
AtCoder编程总决赛,OpenAI的OpenAI - AHC前期领先,后半程失误。人类选手Psycho两次反超夺冠。Psycho曾在OpenAI训练AI胜人类,今挑战老东家成功,网友调侃这或为人类最后一次胜利。>阅读原文
深谋科技:AI大会秀人形机器人核心技术
深谋科技将在2025世界人工智能大会展示新一代人形机器人核心技术,如传感、脑机交互等系统。其认为大模型有局限,明年将推通用具身智能世界模型。>阅读原文
谷歌搜索AI革新:代打电话还会谈价!
谷歌搜索负责人预告三大AI革新,集成Gemini 2.5 Pro、开放Deep Search功能,还有AI代打电话。此功能先在美国上线,全球将跟进,或重塑本地生活逻辑,也引发实用性讨论。>阅读原文
思维链之父跳槽Meta,泄AI未来天机
思维链之父Jason Wei从OpenAI跳槽Meta。他认为人生起步可模仿,站稳后要发挥独有优势。还指出AI领域验证非对称性重要,可验证任务终将被AI攻克。>阅读原文
马斯克征Grok男友名,开源AI女友已火
马斯克为Grok男性数字伴侣征名,网友Jackywine复刻开源3D版AI女友'Bella'。他为其规划'AI原生'演进路径,分三阶段让Bella从感知到有个性,最终实现主动陪伴。>阅读原文
OpenAI推出ChatGPT Agent,似AI打工人上线
OpenAI推出ChatGPT Agent,整合多项能力,Pro等用户可激活。它能完成复杂任务,工具集强大,性能在多测试超人类。不过,因能力强,OpenAI启动最高安全保障。>阅读原文
亚马逊云科技:重新定义AI Agent玩法
亚马逊云科技在纽约峰会聚焦AI Agent,发布企业级搭建工具包Amazon Bedrock AgentCore,还推出相关工具和功能。其认为AI Agent能提升企业效率,市场需求大,已给出投入生产新范式。>阅读原文
产品应用
亚马逊云科技:打造 Agent 落地「金铲子」
亚马逊云科技发力 Agentic AI,推出全新 AgentAI 方案。构建 AgentCore 架构,集成 12 家模型厂商;升级 Strands Agents SDK 到 V1.0;还推出 Kiro 等工具,助力企业 AI 战略落地。>阅读原文
OpenAI 发布 ChatGPT Agent,创业公司压力大
OpenAI 发布 ChatGPT Agent,融合多种能力,有端到端任务执行等亮点,性能出色。不过价格贵、有安全问题,或压缩创业公司空间,未来机会在专用 Agent 及开源框架。>阅读原文
海辛阿文:分享Midjourney动画制作技巧
海辛和阿文受X上Midjourney风格代码启发制作恐龙短片,分享制作技巧。介绍风格代码功能,讲述配色控制方法,还给出复杂动画prompt示例,推荐找代码的作者和网站。>阅读原文
AI算姻缘App狂赚200万,贩卖"希望"!
大厂为AGI、Agent烧钱,"AI算姻缘"App Starla和Astra却靠"GPT对话+AI生图+星盘概念",20天赚超200万美金。它们抓住用户对"灵魂伴侣"的渴望,贩卖"希望",提供了新变现方向。>阅读原文
沃尔玛:揭秘 AI 应用开发平台玩法
沃尔玛披露 AI 应用平台 Walmart Element 细节,它采用"装配线"开发模式,整合数据资源,能快速构建部署应用。展示排班等典型应用,其 2022 年推出,自主构建策略对其他公司有借鉴意义。>阅读原文
OpenAI发布ChatGPT智能体,AI跃升为"真助手"
OpenAI发布ChatGPT智能体,融合网站交互、信息整合与对话能力,能智能选路径完成任务。性能领先,有安全措施。今日部分用户可体验,这或是范式转变。>阅读原文
CopilotKit实战:生成式UI与人类参与流程
文章延续Demo探索CopilotKit应用,包括生成式UI和HITL。前者能动态生成UI元素,后者引入人工决策。CopilotKit降低AI融合门槛,前后端职责分离,有望成智能体人机交互标准。>阅读原文
奥特曼发布ChatGPT「统一智能体」
OpenAI发布ChatGPT agent,融合三大技术,可自主办公,在多基准测试破纪录。2025年将成AI杠杆,让小团队创造大价值,重塑企业架构,开启人机协作新时代。>阅读原文
Second Me:重新定义AI时代数字身份
2025年个人AI分身大规模应用,Second Me成热门开源项目。创始人提出为个体打造专属AI代言人,有保留、放大、连接三价值维度。其聚焦个体数字身份,有望成人机协作信任基础。>阅读原文
甲骨文吴承杨:AI 时代数据融合至关重要
甲骨文吴承杨称 AI 放大数据优势,数据多模融合是大势,Oracle 以一体化架构解决问题。嵇小峰表示企业构建 Agent AI 要关注数据访问需求和安全,还提及向量处理和数据集成等要点。>阅读原文
首钢园活动课:AIGC掀起视频创作效率革命
7月16日晚,首钢园举办"AI视频生成与应用"活动课。达人展示前沿AI平台案例,教学涵盖知识库、工作流搭建等。讲师剖析行业趋势,指出AIGC未来将更多样,降低制作门槛。>阅读原文
00后团队推A股金融智能体FinGenius
00后天才团队发布FinGenius,为A股金融博弈智能体应用。它解决通用AI"水土不服"问题,16个智能体协作,30秒出报告。团队要重塑金融行业,分短期、中期、长期推进计划。>阅读原文
Qwen3-Embedding:高效AI产品关键路径揭秘
文章介绍阿里巴巴 Qwen3-Embedding,它功能多样、成本低,支持多语言。给出在 PAI 和百炼的使用方法,对比它和 LLM,显示其低延迟、低成本优势,还提及工程链路优化技巧。>阅读原文
推荐文章
CUTLASS CuTe:Swizzle模板参数取值分析
文章聚焦CUTLASS CuTe中Swizzle<B, M, S>模板参数选取。以(8, 32):(32, 1)为例,分析M、S与指令及内存结构关系,B避免冲突。给出不同Layout参数取值,方法具扩展性。>阅读原文
Hippocratic AI:估值 16 亿的 AI 护士破局者
Hippocratic AI 针对全球护理短缺,自研底层架构打造多 Agent 系统。产品临床满意度高,已完成多轮融资。但商业化受 AI 能力和人工监督限制,未来或提升渗透率,也可能被并购。>阅读原文
用房价预测入门机器学习全流程
文章围绕房价预测展开,阐述算法工程师开发模型全流程。介绍线性回归等模型,用均方误差评估,经调优、评估后,可从数据、特征和模型层面优化,还提及部署、监控与迭代,助开发者入门。>阅读原文
解析MRAG文档解析与索引关键技术
文章介绍MRAG 5项关键技术之一解析、索引。多模态文档分三类,解析方法有基于提取和表示两种。基于提取的方法有局限,如耗时、易丢信息、错误会传播。>阅读原文
开源动态
500美元!华人团队模型重构视频生成范式
香港城市大学等团队推出Pusa V1.0图像 - 视频生成模型,引入VTA机制,用低成本微调超越同类模型达SOTA。VTA让帧独立演化,使视频动态连贯自然,还解锁多任务能力。>阅读原文
Goedel - Prover - V2:8B参数暴击671B模型
普林斯顿等八大机构推出Goedel - Prover - V2,在多个数学基准测试夺冠,小参数8B版击败671B的DeepSeek - Prover,采用分层数据合成等技术,计算开销可控。>阅读原文
普林斯顿团队推最强开源数学定理证明模型
普林斯顿大学牵头多机构推出 Goedel-Prover-V2 模型。32B 旗舰模型性能大幅超越前代 SOTA,8B 小模型特定基准表现相当。有三项创新,团队公开模型与数据集,助力开源研究。>阅读原文
Trivy:研发团队必备开源安全扫描工具
Trivy是定位清晰、性能优越的开源安全扫描工具,支持多目标、多维扫描,速度快、集成灵活。能用于DevSecOps等流程,相比传统工具更轻量灵活,是DevSecOps团队首选。>阅读原文
算法论文
Evaluation Agent:视觉生成模型评估新范式
上海人工智能实验室与南洋理工大学团队研发 Evaluation Agent,入选 ACL 2025 Oral 论文。它可按需评估,效率高、可解释,未来将扩展评估能力、优化机制并迈向智能推荐。>阅读原文
斯坦福等团队提出大模型数学证明评测标准
斯坦福等团队针对大语言模型数学证明能力提出新思路,构建IneqMath数据集和'AI数学裁判系统'。研究发现模型'答案准'不代表'推得对',并给出自我批判和定理提示两个提升准确率的办法。>阅读原文
Google DeepMind:递归语言模型性能超传统
Google DeepMind研究者设计语言模型,处理语句时能判断关键单词深度递归,用"路由器"节省计算资源,同等成本下表现超传统模型,文中还介绍其他动态算力分配思路。>阅读原文
DrafterBench评测:大模型下工地能力待提升
加拿大麦吉尔大学等团队推出DrafterBench评估基准,评测主流大模型在土木工程图纸修改任务的表现。结果显示模型有一定能力,但整体水平未达工程一线要求,后续将拓展更多工程场景。>阅读原文
西湖大学:新算法破解流体力学建模难题
西湖大学冯浩东、范迪夏等提出RPLPO和PIPO算法。RPLPO解决部分观测下PDE loss误差,PIPO应对不准确物理信息。实验显示算法提升泛化与预测精度,未来将探索多物理场耦合等问题。>阅读原文
Google提出Concordia构建多智能体游戏引擎
Google等提出Concordia,打破传统游戏逻辑,以AI驱动的智能体当GM。基于「实体 - 组件」架构,工程师造组件,设计师组合用,能满足评估、戏剧、模拟等多种生成式AI使用需求。>阅读原文
Bind-Your-Avatar:免剪辑生成多角色对话视频
研究人员提出Bind-Your-Avatar框架,通过细粒度嵌入路由绑定语音与角色,实现音画同步。还构建MTCC数据集和基准测试,实验表明其在身份保真和音画同步上优于现有方法,后续将开源。>阅读原文
Oasis:仅靠图像实现多模态指令数据合成
同济大学等研究者提出 Oasis 多模态指令数据合成方法,仅靠图像生成数据,打破传统模式。开源代码库 MM - INF,实验表明其数据多样、可扩展,能显著提升 MLLM 性能,还能回收利用丢弃数据。>阅读原文
谷歌新架构MoR:有望成Transformer杀手
谷歌DeepMind发布新架构MoR,在递归Transformer基础上进化。它统一实现参数共享、计算路由和递归级缓存,兼顾性能与效率。实验表明推理吞吐量提升,少参数也能优于基线模型,但能否成"Transformer杀手"存疑。>阅读原文
AI4Research:科学研究AI应用全面综述
该综述指出,AI4Research可分五个关键领域,如科学理解、学术调查等,各领域有细分任务。AI能在研究全流程发挥多样作用,还应用于自然、应用、社会科学等多学科。>阅读原文
FreeMorph:一步到位的图像morphing方法
南洋理工大学等团队提出FreeMorph方法解决图像morphing难题。它改进扩散模型注意力机制,有引导感知球面插值和步骤导向变化趋势两创新,实验显示能处理多样图像,超越现有技术,但有一定局限。>阅读原文
ICLR论文解决强化学习两大「大坑」
Mila 实验室两篇 ICLR 2025 论文解决强化学习两大难题。一篇提出交错推理框架消除无动作遗憾,另一篇引入并行计算与时序跳跃连接减少延迟遗憾,结合使用能推动其在关键领域应用。>阅读原文
一个标点竟能骗倒LLM裁判!
研究发现:仅一个标点或推理开场白就能欺骗LLM裁判,在顶级模型中攻击成功率达80%,致强化学习训练崩溃。提出的Master - RM模型FPR近乎0%,保持通用裁判能力,为RLVR提供高鲁棒性方案。>阅读原文
广义智能体理论:通向「万物理论」新路径
刘锋团队提出广义智能体理论,认为物理、生命、AI系统都是智能体,引力等或源于「智能场」。该理论为统一物理理论提供新思路,虽待验证,但有望成探索「万物理论」新路径。>阅读原文
bash
</p>