AI Daily | AI日报:AWS:破解Agentic AI落地难题; 谷歌MoR架构:或成Transformer杀手; 米哈游5亿成立新公司,AI布局野心大

All in AI,看见未来。 每天精选最值得读的AI文章,帮你筛掉时代的噪音。 以简讯见广度,以深读见洞察。 技术、趋势、思考,一站式掌握AI世界。 欢迎关注公众号「AI Reading Hub」,获取更多AI资讯和技术文章。

2025-07-18 资讯日报

新闻资讯

AWS:破解Agentic AI落地难题

红杉美国合伙人预测2025年为AI agent元年,但Agentic AI落地难。AWS发布系列产品,如支持长时间运行负载的Amazon Bedrock AgentCore等,还升级存储与市场服务,或成企业构建选择。>阅读原文

谷歌MoR架构:或成Transformer杀手

谷歌推出Mixture-of-Recursions(MoR)架构,在单一框架实现参数共享与自适应计算统一。实验显示,其性能超Transformer,计算效率高、可扩展性强,网友猜测或改变AI规则。>阅读原文

米哈游5亿成立新公司,AI布局野心大

米哈游动作不断,5亿成立无定谷科技。其早涉足AI,有自研模型,创始人蔡浩宇创业成果《Whispers from the Star》试玩。还与马斯克的AI女友Ani互动,两款产品方向不同。>阅读原文

OpenAI发布ChatGPT Agent,Agent创业者慌了

OpenAI发布ChatGPT Agent,整合多种能力,支持网页浏览、代码运行等。新模型经强化训练,在多基准测试中表现超竞品和旧版。这或使初创公司转向垂类Agent赛道。>阅读原文

苹果MLX框架主动适配英伟达CUDA

苹果为扩大影响力,让MLX框架适配CUDA。因CUDA在AI开发占主导,生态强,开发者多,且不允许在非英伟达平台运行程序,苹果此举既合规,又能借势发展。>阅读原文

特朗普宣布900亿建宾夕法尼亚AI中心

特朗普:宣布超900亿美元投资,要将宾夕法尼亚州打造成美国AI核心。谷歌、黑石等积极参与,涉及数据中心、能源基建等项目,还强调"能源安全人工智能"理念,将创造大量工作岗位。>阅读原文

OpenAI发布ChatGPT Agent,创业赛道生变

OpenAI发布ChatGPT Agent,将思考与执行能力整合,工作生活场景皆适用。它优化后能力达SOTA,不过也有风险。这或重塑互联网,让Agent创业者重新审视自身竞争力。>阅读原文

黄仁勋:中国AI与电动汽车令人惊叹

黄仁勋认为中国供应链先进、AI发展快,H20芯片解禁后将满足需求。他称赞中国电动汽车,尊重对手,不担忧贸易限制。他鼓励年轻人投身AI,还分享多AI比对提问的方法。>阅读原文

Claude Code主创回归,Anthropic估值冲千亿

Claude Code主创跳槽后回归Anthropic。该公司正洽谈新一轮融资,目标估值1000亿美元。Claude Code表现出色,收入增长快,还将推分析仪表盘,Cursor收入增长也让Anthropic受益。>阅读原文

OpenAI推出ChatGPT Agent,能力升级但有风险

OpenAI发布ChatGPT Agent,实现通用智能体能力升级,可完成复杂任务,已向部分用户开放。它整合多能力、配工具,基准测试表现好。不过有安全风险,网友体验有亮点也指出待改进处。>阅读原文

OpenAI发布ChatGPT Agent,或为GPT-5前菜

OpenAI发布ChatGPT Agent,能完成多类任务,如生活、办公等。测试表现不错,但离人类能力有差距。它是GPT - 5前菜,从提示式转向委托式协作,重新定义人机交互,不过也有安全风险。>阅读原文

Mistral AI:Le Chat对标ChatGPT穷追不舍

欧洲AI初创公司Mistral AI很躁动,连发多个开源模型。还升级Le Chat,功能全对标ChatGPT。其语音模型Voxtral号称最佳,多方面超竞品,展现欧洲在大模型领域的追赶势头。>阅读原文

Lovable 融资 2 亿,Beehiiv 年收破 3000 万

Lovable 完成 2 亿美金 A 轮融资,活跃用户 230 万,ARR 近 9000 万美金。每月 10 万家创业公司在此成立。Beehiiv 年营收破 3000 万美金,创始人分享 20 条创业心得,如顾问用处不大等。>阅读原文

Meta重金抢人,难复制DeepSeek成功

Meta 扎克伯格重金招人,组建豪华 AI 战队。但组织天才协同才是关键,DeepSeek 团队小、扁平化却成功逆袭。Meta 组织惯性大,难复制其成功,AI 行业组织重构能力或更重要。>阅读原文

OpenAI发布ChatGPT Agent,智能体赛道生变

OpenAI发布ChatGPT Agent,可自主思考选工具完成复杂任务。CEO Sam Altman称其能力强但有风险,内置安全机制。测试成绩优异,网友期待体验,认为或推动生产力革命。>阅读原文

OpenAI前员工深度反思公司内外情况

OpenAI前员工:在极速扩张下,公司沟通、管理等面临挑战,文化独特,技术受Meta影响。Codex项目7周完成发布,成果显著。认为AGI竞赛在OpenAI、Anthropic和Google间展开。>阅读原文

人类选手Psycho击败OpenAI获编程冠军

AtCoder编程总决赛,OpenAI的OpenAI - AHC前期领先,后半程失误。人类选手Psycho两次反超夺冠。Psycho曾在OpenAI训练AI胜人类,今挑战老东家成功,网友调侃这或为人类最后一次胜利。>阅读原文

深谋科技:AI大会秀人形机器人核心技术

深谋科技将在2025世界人工智能大会展示新一代人形机器人核心技术,如传感、脑机交互等系统。其认为大模型有局限,明年将推通用具身智能世界模型。>阅读原文

谷歌搜索AI革新:代打电话还会谈价!

谷歌搜索负责人预告三大AI革新,集成Gemini 2.5 Pro、开放Deep Search功能,还有AI代打电话。此功能先在美国上线,全球将跟进,或重塑本地生活逻辑,也引发实用性讨论。>阅读原文

思维链之父跳槽Meta,泄AI未来天机

思维链之父Jason Wei从OpenAI跳槽Meta。他认为人生起步可模仿,站稳后要发挥独有优势。还指出AI领域验证非对称性重要,可验证任务终将被AI攻克。>阅读原文

马斯克征Grok男友名,开源AI女友已火

马斯克为Grok男性数字伴侣征名,网友Jackywine复刻开源3D版AI女友'Bella'。他为其规划'AI原生'演进路径,分三阶段让Bella从感知到有个性,最终实现主动陪伴。>阅读原文

OpenAI推出ChatGPT Agent,似AI打工人上线

OpenAI推出ChatGPT Agent,整合多项能力,Pro等用户可激活。它能完成复杂任务,工具集强大,性能在多测试超人类。不过,因能力强,OpenAI启动最高安全保障。>阅读原文

亚马逊云科技:重新定义AI Agent玩法

亚马逊云科技在纽约峰会聚焦AI Agent,发布企业级搭建工具包Amazon Bedrock AgentCore,还推出相关工具和功能。其认为AI Agent能提升企业效率,市场需求大,已给出投入生产新范式。>阅读原文

产品应用

亚马逊云科技:打造 Agent 落地「金铲子」

亚马逊云科技发力 Agentic AI,推出全新 AgentAI 方案。构建 AgentCore 架构,集成 12 家模型厂商;升级 Strands Agents SDK 到 V1.0;还推出 Kiro 等工具,助力企业 AI 战略落地。>阅读原文

OpenAI 发布 ChatGPT Agent,创业公司压力大

OpenAI 发布 ChatGPT Agent,融合多种能力,有端到端任务执行等亮点,性能出色。不过价格贵、有安全问题,或压缩创业公司空间,未来机会在专用 Agent 及开源框架。>阅读原文

海辛阿文:分享Midjourney动画制作技巧

海辛和阿文受X上Midjourney风格代码启发制作恐龙短片,分享制作技巧。介绍风格代码功能,讲述配色控制方法,还给出复杂动画prompt示例,推荐找代码的作者和网站。>阅读原文

AI算姻缘App狂赚200万,贩卖"希望"!

大厂为AGI、Agent烧钱,"AI算姻缘"App Starla和Astra却靠"GPT对话+AI生图+星盘概念",20天赚超200万美金。它们抓住用户对"灵魂伴侣"的渴望,贩卖"希望",提供了新变现方向。>阅读原文

沃尔玛:揭秘 AI 应用开发平台玩法

沃尔玛披露 AI 应用平台 Walmart Element 细节,它采用"装配线"开发模式,整合数据资源,能快速构建部署应用。展示排班等典型应用,其 2022 年推出,自主构建策略对其他公司有借鉴意义。>阅读原文

OpenAI发布ChatGPT智能体,AI跃升为"真助手"

OpenAI发布ChatGPT智能体,融合网站交互、信息整合与对话能力,能智能选路径完成任务。性能领先,有安全措施。今日部分用户可体验,这或是范式转变。>阅读原文

CopilotKit实战:生成式UI与人类参与流程

文章延续Demo探索CopilotKit应用,包括生成式UI和HITL。前者能动态生成UI元素,后者引入人工决策。CopilotKit降低AI融合门槛,前后端职责分离,有望成智能体人机交互标准。>阅读原文

奥特曼发布ChatGPT「统一智能体」

OpenAI发布ChatGPT agent,融合三大技术,可自主办公,在多基准测试破纪录。2025年将成AI杠杆,让小团队创造大价值,重塑企业架构,开启人机协作新时代。>阅读原文

Second Me:重新定义AI时代数字身份

2025年个人AI分身大规模应用,Second Me成热门开源项目。创始人提出为个体打造专属AI代言人,有保留、放大、连接三价值维度。其聚焦个体数字身份,有望成人机协作信任基础。>阅读原文

甲骨文吴承杨:AI 时代数据融合至关重要

甲骨文吴承杨称 AI 放大数据优势,数据多模融合是大势,Oracle 以一体化架构解决问题。嵇小峰表示企业构建 Agent AI 要关注数据访问需求和安全,还提及向量处理和数据集成等要点。>阅读原文

首钢园活动课:AIGC掀起视频创作效率革命

7月16日晚,首钢园举办"AI视频生成与应用"活动课。达人展示前沿AI平台案例,教学涵盖知识库、工作流搭建等。讲师剖析行业趋势,指出AIGC未来将更多样,降低制作门槛。>阅读原文

00后团队推A股金融智能体FinGenius

00后天才团队发布FinGenius,为A股金融博弈智能体应用。它解决通用AI"水土不服"问题,16个智能体协作,30秒出报告。团队要重塑金融行业,分短期、中期、长期推进计划。>阅读原文

Qwen3-Embedding:高效AI产品关键路径揭秘

文章介绍阿里巴巴 Qwen3-Embedding,它功能多样、成本低,支持多语言。给出在 PAI 和百炼的使用方法,对比它和 LLM,显示其低延迟、低成本优势,还提及工程链路优化技巧。>阅读原文

推荐文章

CUTLASS CuTe:Swizzle模板参数取值分析

文章聚焦CUTLASS CuTe中Swizzle<B, M, S>模板参数选取。以(8, 32):(32, 1)为例,分析M、S与指令及内存结构关系,B避免冲突。给出不同Layout参数取值,方法具扩展性。>阅读原文

Hippocratic AI:估值 16 亿的 AI 护士破局者

Hippocratic AI 针对全球护理短缺,自研底层架构打造多 Agent 系统。产品临床满意度高,已完成多轮融资。但商业化受 AI 能力和人工监督限制,未来或提升渗透率,也可能被并购。>阅读原文

用房价预测入门机器学习全流程

文章围绕房价预测展开,阐述算法工程师开发模型全流程。介绍线性回归等模型,用均方误差评估,经调优、评估后,可从数据、特征和模型层面优化,还提及部署、监控与迭代,助开发者入门。>阅读原文

解析MRAG文档解析与索引关键技术

文章介绍MRAG 5项关键技术之一解析、索引。多模态文档分三类,解析方法有基于提取和表示两种。基于提取的方法有局限,如耗时、易丢信息、错误会传播。>阅读原文

开源动态

500美元!华人团队模型重构视频生成范式

香港城市大学等团队推出Pusa V1.0图像 - 视频生成模型,引入VTA机制,用低成本微调超越同类模型达SOTA。VTA让帧独立演化,使视频动态连贯自然,还解锁多任务能力。>阅读原文

Goedel - Prover - V2:8B参数暴击671B模型

普林斯顿等八大机构推出Goedel - Prover - V2,在多个数学基准测试夺冠,小参数8B版击败671B的DeepSeek - Prover,采用分层数据合成等技术,计算开销可控。>阅读原文

普林斯顿团队推最强开源数学定理证明模型

普林斯顿大学牵头多机构推出 Goedel-Prover-V2 模型。32B 旗舰模型性能大幅超越前代 SOTA,8B 小模型特定基准表现相当。有三项创新,团队公开模型与数据集,助力开源研究。>阅读原文

Trivy:研发团队必备开源安全扫描工具

Trivy是定位清晰、性能优越的开源安全扫描工具,支持多目标、多维扫描,速度快、集成灵活。能用于DevSecOps等流程,相比传统工具更轻量灵活,是DevSecOps团队首选。>阅读原文

算法论文

Evaluation Agent:视觉生成模型评估新范式

上海人工智能实验室与南洋理工大学团队研发 Evaluation Agent,入选 ACL 2025 Oral 论文。它可按需评估,效率高、可解释,未来将扩展评估能力、优化机制并迈向智能推荐。>阅读原文

斯坦福等团队提出大模型数学证明评测标准

斯坦福等团队针对大语言模型数学证明能力提出新思路,构建IneqMath数据集和'AI数学裁判系统'。研究发现模型'答案准'不代表'推得对',并给出自我批判和定理提示两个提升准确率的办法。>阅读原文

Google DeepMind:递归语言模型性能超传统

Google DeepMind研究者设计语言模型,处理语句时能判断关键单词深度递归,用"路由器"节省计算资源,同等成本下表现超传统模型,文中还介绍其他动态算力分配思路。>阅读原文

DrafterBench评测:大模型下工地能力待提升

加拿大麦吉尔大学等团队推出DrafterBench评估基准,评测主流大模型在土木工程图纸修改任务的表现。结果显示模型有一定能力,但整体水平未达工程一线要求,后续将拓展更多工程场景。>阅读原文

西湖大学:新算法破解流体力学建模难题

西湖大学冯浩东、范迪夏等提出RPLPO和PIPO算法。RPLPO解决部分观测下PDE loss误差,PIPO应对不准确物理信息。实验显示算法提升泛化与预测精度,未来将探索多物理场耦合等问题。>阅读原文

Google提出Concordia构建多智能体游戏引擎

Google等提出Concordia,打破传统游戏逻辑,以AI驱动的智能体当GM。基于「实体 - 组件」架构,工程师造组件,设计师组合用,能满足评估、戏剧、模拟等多种生成式AI使用需求。>阅读原文

Bind-Your-Avatar:免剪辑生成多角色对话视频

研究人员提出Bind-Your-Avatar框架,通过细粒度嵌入路由绑定语音与角色,实现音画同步。还构建MTCC数据集和基准测试,实验表明其在身份保真和音画同步上优于现有方法,后续将开源。>阅读原文

Oasis:仅靠图像实现多模态指令数据合成

同济大学等研究者提出 Oasis 多模态指令数据合成方法,仅靠图像生成数据,打破传统模式。开源代码库 MM - INF,实验表明其数据多样、可扩展,能显著提升 MLLM 性能,还能回收利用丢弃数据。>阅读原文

谷歌新架构MoR:有望成Transformer杀手

谷歌DeepMind发布新架构MoR,在递归Transformer基础上进化。它统一实现参数共享、计算路由和递归级缓存,兼顾性能与效率。实验表明推理吞吐量提升,少参数也能优于基线模型,但能否成"Transformer杀手"存疑。>阅读原文

AI4Research:科学研究AI应用全面综述

该综述指出,AI4Research可分五个关键领域,如科学理解、学术调查等,各领域有细分任务。AI能在研究全流程发挥多样作用,还应用于自然、应用、社会科学等多学科。>阅读原文

FreeMorph:一步到位的图像morphing方法

南洋理工大学等团队提出FreeMorph方法解决图像morphing难题。它改进扩散模型注意力机制,有引导感知球面插值和步骤导向变化趋势两创新,实验显示能处理多样图像,超越现有技术,但有一定局限。>阅读原文

ICLR论文解决强化学习两大「大坑」

Mila 实验室两篇 ICLR 2025 论文解决强化学习两大难题。一篇提出交错推理框架消除无动作遗憾,另一篇引入并行计算与时序跳跃连接减少延迟遗憾,结合使用能推动其在关键领域应用。>阅读原文

一个标点竟能骗倒LLM裁判!

研究发现:仅一个标点或推理开场白就能欺骗LLM裁判,在顶级模型中攻击成功率达80%,致强化学习训练崩溃。提出的Master - RM模型FPR近乎0%,保持通用裁判能力,为RLVR提供高鲁棒性方案。>阅读原文

广义智能体理论:通向「万物理论」新路径

刘锋团队提出广义智能体理论,认为物理、生命、AI系统都是智能体,引力等或源于「智能场」。该理论为统一物理理论提供新思路,虽待验证,但有望成探索「万物理论」新路径。>阅读原文

bash 复制代码
    </p>
    

官网:www.AiReadingHub.com

相关推荐
DyLatte2 小时前
你不是做的不够多,而是做的还不够好
程序员
骑猪兜风2332 小时前
8 小时打磨的 AI 开发者日报,上线 3 天狂揽1000+ 精准用户!
aigc·openai·ai编程
LovelyAqaurius3 小时前
了解Unity中的URP Renderer Features:Object Renderer Features
程序员
后端小肥肠3 小时前
首尾帧衔接0破绽!用Coze一键生成10w+历史人物的一生视频,小白也能月更30条
人工智能·aigc·coze
SimonKing4 小时前
Java 8 日期时间 API 全面指南:使用技巧与场景实践
java·后端·程序员
程序员鱼皮6 小时前
会Vibe Coding的同事:我一个人干掉整个技术部!
ai·程序员·互联网·编程·开发·代码
top_designer6 小时前
3D材质总监的“光影魔法”:用Substance Sampler AI,“擦除”照片中的光影
人工智能·3d·新媒体运营·aigc·游戏程序·材质·材质设计师
liangdabiao6 小时前
不求人!Wordpress + WooCommerce 自定义商店前端 - 简单高效方法介绍 - 轻松解决问题
程序员·开源