AI Weekly 3.16-3.22

本周 AI 快讯 | 1 分钟速览

01 Cursor Composer 2 被扒出底层是 Kimi K2.5,月之暗面证实授权合作 :开发者在 API 中发现 Kimi K2.5 模型标识,Cursor 通过 Fireworks 推理平台接入并经 4 倍规模强化学习微调;月之暗面先质疑后确认商业授权,24 小时内争议反转。

02 小米 MiMo-V2 三连发,OpenRouter 匿名霸榜模型揭晓,雷军宣布三年投入 600 亿MiMo-V2-ProOmniTTS 三款大模型同步上线,联合 5 大 Agent 框架开放免费 API 一周;此前连续霸榜 OpenRouter 日榜的匿名模型 Hunter Alpha 正是 MiMo-V2-Pro 早期测试版。

03 千问 Qwen3.5-Max 登顶 LMArena 中国第一,全球排名第六 :预览版斩获 1464 分,超越 GPT-5.4Grok 4.1 及全部国产模型;5 家中国公司闯入 LMArena 全球前十。

04 MiniMax M2.7 首秀「模型自我进化」,SWE-Pro 56.22% 接近 GPT-5.3-Codex :模型自主完成 100+ 轮迭代,内部评测效果提升 30%;VIBE-Pro 55.6% 接近 Opus 4.6,定价 0.3 美元/百万 token 不变。

05 腾讯 QClaw 全量公测,龙虾生态一周新增五个入口 :免邀请码 20 秒安装,打通企微、QQ、飞书、钉钉远控通道;智谱发布龙虾优化模型 GLM-5-Turbo,QQ 机器人接入 OpenClaw,腾讯云推出官网 Agent 助手 KiKi。

06 乐天号称「日本最强 AI」发布数小时即翻车,底层就是 DeepSeek V3Rakuten AI 3.0 宣称 7000 亿参数日语超越 GPT-4o,技术社区当天从配置文件中揪出 DeepSeek V3 架构,初始版本未做任何标注。

07 OpenAI 发布 GPT-5.4 mini 和 nano,补齐小模型阵线 :mini SWE-Bench Pro 54.4% 逼近满血版 57.7%,nano 定价 0.2 美元/百万 token 为家族最低;mini 首次进入 ChatGPT 免费层,GitHub Copilot 同日接入。

08 Claude Code 接入 Telegram 和 Discord,Cowork 上线「Projects」 :「Channels」功能让开发者手机遥控编程会话,Cowork Projects 支持持久工作区、项目级记忆和调度任务,文件与指令本地存储。

09 Google AI Studio 推翻重构,从原型玩具升级全栈开发平台 :4 个月从零重建,Antigravity 编码 Agent 驱动 prompt 到部署全链路,集成 Firebase 自动配置认证和数据存储,内部团队已构建数十万应用。

10 Midjourney V8 Alpha 发布,生成速度飙升 5 倍 :原生 2K 高清模式,文字渲染准确度大幅增强,完美兼容 V7 个性化配置;目前仅在 alpha.midjourney.com 可用。


01|Cursor「Composer 2」被扒出底层是 Kimi K2.5,24 小时从争议到和解

一个被埋在 API 里的模型 ID,引爆了本周最大争议。3 月 19 日 Cursor 发布 Composer 2Composer 2 Fast 两款编程模型,主打 20 万 token 上下文和「长周期智能体编程」。不到 24 小时,开发者 @fynnso 在操作 base URL 时发现模型 ID 为 kimi-k2p5-rl-0317-s515-fast,推测 Composer 2 的底座就是带强化学习的 Kimi K2.5。帖子浏览量迅速突破 44 万,马斯克回复称「Yeah, it's Kimi 2.5」。

月之暗面预训练负责人杜羽伦随即在社交媒体质疑 Cursor 未遵守 Kimi K2.5 的 Modified MIT 许可协议------该协议要求月收入超 2000 万美元或月活超 1 亿的商业产品必须在界面显著标注模型名称。以 Cursor 当前约 20 亿美元年化收入估算,远超触发门槛。杜羽伦经 tokenizer 比对确认底层一致后,先发帖再删帖,另一位员工也经历了同样的「确认-删除」循环。3 月 21 日月之暗面官方发文确认这是通过 Fireworks 推理平台达成的授权合作,Cursor 联合创始人 Aman Sanger 解释团队在多个底座上做了评估,Kimi K2.5 表现最强,后续叠加了 4 倍规模的强化学习。一场「套壳」风波 24 小时内反转为国产模型被全球顶级编程工具选为底座的出海样本。


02|小米「MiMo-V2」三连发,OpenRouter 匿名霸榜模型揭晓,雷军宣布三年 600 亿

OpenRouter 日榜上连续霸榜的匿名模型 Hunter Alpha 和 Healer Alpha,本周终于揭开面纱------它们是小米 MiMo-V2-ProMiMo-V2-Omni 的早期测试版。3 月 19 日小米春季发布会尾声,雷军宣布未来三年在 AI 领域投入 600 亿元,同步推出 MiMo-V2-ProMiMo-V2-OmniMiMo-V2-TTS 三款大模型,联合 OpenClaw、OpenCode、KiloCode、Cline、Blackbox 五大 Agent 框架开放为期一周的免费 API。

从上期小米 17 系列首发 MiMo 模型,到这周以匿名身份在全球最大 API 聚合平台上验证实力再高调揭晓,小米 AI 的节奏越来越像手机业务的打法------先低调测试,再集中引爆。目前三款模型已登陆 Xiaomi miclaw、MiMo Studio、金山办公和小米浏览器,MiMo Studio 官网同步上线了 Xiaomi MiMo Claw,免费体验。600 亿的三年投入约相当于小米 2025 年全年研发费用的两倍,AI 在小米内部的优先级已和造车平齐。


03|千问「Qwen3.5-Max」登顶 LMArena,1464 分拿下中国第一

1464 分,全球第六,中国第一。3 月 20 日 LMArena 更新排名,阿里千问旗舰预览版 Qwen3.5-Max-Preview 首度亮相,在全球盲测中超越 GPT-5.4Grok 4.1 以及豆包 2.0GLM-5Kimi 2.5 等全部国产模型。分项数学能力排名全球第五,专家级文本处理能力全球第十。

在 LMArena 基于模型能力对全球公司排名的榜单中,5 家中国公司闯入前十,阿里位列全球前五、中国第一,字节、智谱、月之暗面、百度紧随其后。千问 3.5 系列于今年除夕首发,目前已开源 0.8B 至 397B 共 8 款不同尺寸模型,此次亮相的是旗舰预览版,正式版据称近期发布。从开源小模型到闭源旗舰同时发力,阿里在大模型赛道上的投入密度已是国内最高。


04|MiniMax「M2.7」首秀模型自我进化,SWE-Pro 56.22% 接近 GPT-5.3-Codex

3 月 18 日发布的 M2.7 是 MiniMax 新一代 Agent 旗舰模型,通过构建 Agent Harness 体系,模型在部分研发场景中可承担约 30%-50% 的工作量。实际操作中,M2.7 自主更新记忆、构建数十个复杂技能、跑强化学习实验并根据结果改进自身学习流程,自主完成了 100+ 轮迭代循环,内部评测效果提升约 30%。

编程基准方面,M2.7 在 SWE-Pro 上拿到 56.22%,接近 GPT-5.3-Codex 的 56.8%;VIBE-Pro 全项目交付得分 55.6%,几乎与 Opus 4.6 持平;Terminal Bench 2 复杂工程理解得分 57.0%。定价维持 0.3 美元/百万输入 token、1.2 美元/百万输出 token,仍是全球最便宜的前沿模型之一。「模型自我进化」目前更接近概念验证而非成熟能力,但如果模型能可靠地改进自己的训练流程,研发效率的天花板就不再是人力。


05|腾讯「QClaw」全量公测,龙虾生态一周新增五个入口

3 月 20 日,腾讯宣布 QClaw 正式全量公测,免邀请码,官网下载最新版本 20 秒完成安装。新版本打通了企业微信、QQ、飞书、钉钉等多平台远控通道,新增「龙虾像素工作室」和定时任务功能。同周,QQ 机器人接入 OpenClaw(3/16),智谱发布首个龙虾场景深度优化的基础模型 GLM-5-Turbo(3/16),腾讯云推出行业首个官网内置 Agent 助手 KiKi(3/21),腾讯元宝换上拟人化新 Logo、给元宝加了一双大眼睛(3/20)。

上期已经写过腾讯全系龙虾产品矩阵集结,这周的核心变化是从「发布」转入「跑量」------QClaw 全量公测意味着龙虾不再是 KOL 的玩具,而是普通用户可以 20 秒上手的工具。智谱 GLM-5-Turbo 从训练阶段就针对 OpenClaw 核心需求做专项优化,这说明第三方模型厂商已开始为龙虾生态定制模型,龙虾正从客户端竞争演变为生态竞争。同周英伟达在 GTC 上正式发布 NemoClaw 软件栈,黄仁勋现场演示一条指令部署 Nemotron 模型和 OpenShell 运行环境------GPU 巨头也下场了。


06|乐天号称「日本最强 AI」,发布当天被扒出就是 DeepSeek V3

号称 7000 亿参数、日语能力超越 GPT-4o 的「日本国内最大规模高性能 AI 模型」,发布当天就翻车了。3 月 17 日日本乐天集团发布 Rakuten AI 3.0,技术社区数小时内就从配置文件中确认其核心架构完全基于 DeepSeek V3,初始版本未对原创者做任何标注。日本网友在社交媒体上大量吐槽,「日本最强国产 AI」瞬间变成「最快打脸」。

乐天随后补上了 DeepSeek 的署名,但品牌损害已经造成。和本期第 01 条 Cursor/Kimi 事件对比更有意思------同一周,两家公司都被扒出底层用了中国模型,但 Cursor 的结局是确认授权、双方站台;乐天的结局是被技术社区嘲讽了一整天。区别在于 Cursor 做了商业授权只是没公开标注,乐天连标注都没有。开源模型「拿来即用」的便利正在催生一波署名合规问题,DeepSeek V3Kimi K2.5 已是全球被「套壳」频率最高的两个中国底座。


07|OpenAI 发布「GPT-5.4 mini」和「nano」,两周补齐小模型阵线

3 月 17 日,GPT-5.4 发布仅两周后,OpenAI 推出 GPT-5.4 mini 在 SWE-Bench Pro 上拿到 54.4%,逼近满血版的 57.7%;OSWorld 72.1%,大幅领先上代 GPT-5 mini 的 42.0%;吞吐量约 180-190 tok/s,是上代的 3 倍以上。GPT-5.4 nano 定位更轻量的子任务场景,定价 0.2 美元/百万输入 token,是 GPT-5.4 家族最便宜的成员,低于谷歌 Gemini 3.1 Flash-Lite 的 0.25 美元。

GPT-5.4 mini 首次进入 ChatGPT 免费层,GitHub Copilot 同日接入;nano 仅限 API,主打分类、数据抽取和编程子 Agent。在 Codex 中,GPT-5.4 负责规划和判断,mini 子 Agent 并行处理搜索代码库、审查文件等窄任务,大小模型协作的分层架构正在成为标配。同周 Mistral 也发布了 Mistral Small 4,119B 参数 MoE 架构仅 6B 激活参数,Apache 2.0 开源,定价 0.15 美元/百万 token,256K 上下文------小模型赛道的价格战已经开打。


08|Claude Code 接入 Telegram 和 Discord,「Channels」手机遥控编程会话

七周前,Anthropic 发律师函逼 OpenClaw 改了两次名。七周后,它自己做了一只。3 月 20 日上线的 Claude Code Channels 让开发者通过 Telegram 或 Discord 向正在运行的 Claude Code 会话推送消息,本质是一个 MCP Server,以 Bun 运行时为基础,支持双向通信。你电脑上的 Claude Code 跑着测试,你人在地铁上用手机问一句「跑完了吗」,Claude 回「还在测,好了叫你」------跟在群里 @ 同事没什么区别。

同日 Anthropic 为 Cowork 桌面应用上线「Projects」,支持持久工作区、项目级记忆和调度任务,文件与指令本地存储。Channels 目前为研究预览,需 Claude Code v2.1.80 以上版本,仅支持 Claude 订阅登录。本地 Agent 赛道这周格外拥挤------Meta 旗下 Manus 发布「My Computer」桌面版(3/16),Agent 可直接操作本地文件和应用,起步价 20 美元/月;马斯克回复确认 xAI 的「Grok Computer」即将上线,同时彭博社报道 xAI 开始派工程师驻场客户办公室推动落地。从云端到桌面再到手机,Agent 的触达半径一周一扩。


09|Google AI Studio 推翻重构,4 个月从原型玩具变全栈开发平台

4 个月,从零重建。3 月 19 日上线的 Google AI Studio 新版已经不是当初那个测试 Gemini 模型的 prompt 游乐场,而是一个可以从自然语言描述直接生成、部署、上线完整应用的全栈开发平台。背后驱动力是谷歌的 Antigravity 编码 Agent,集成 Firebase 自动处理用户认证和数据存储,谷歌称内部团队已用它构建了数十万个应用。

谷歌同步宣布关闭 Firebase Studio、将其功能迁移至 AI Studio,Pro 订阅无需额外配额即可使用最新 Gemini 3.1 Pro,免费用户也可通过 AI Studio 访问。AI Studio 负责人 Logan Kilpatrick 透露路线图包括 Google Workspace 集成(Drive、Sheets)、一键部署到 Antigravity、接入支付处理和实时数据源。谷歌瞄准的不是 Cursor 和 Windsurf 的用户------那些人已经会写代码------而是那些从来没写过代码但有产品想法的人。


10|Midjourney「V8」Alpha 发布,完成自 V5 以来最大一次重写

3 月 17 日发布的 Midjourney V8 Alpha 在 alpha.midjourney.com 上线,生成速度约为 V7 的 5 倍,原来需要 30-60 秒的图现在 10 秒内出结果。新增原生 2K 高清模式(--hd 参数),文字渲染准确度大幅提升,复杂多元素构图中的颜色、空间、材质还原度明显优于 V7

V8 标准生成不额外收费,但 --hd--q 4、风格参考和 Moodboard 作业耗时和成本均为标准作业的 4 倍,Relax 模式暂不支持。Midjourney 官方建议搭配 --raw 模式和高风格化参数(--stylize 1000)发挥最佳效果,并强调长提示比短提示效果更好------和 V7 的使用习惯恰好相反。目前 V8 仅在 Alpha 站点可用,不支持 Discord 和主站,in-painting 和 out-painting 暂缺。

相关推荐
piao9618273 小时前
2026企业数字化转型新变量:面向B端的高可信AI智能体选型与数据主权实践
人工智能
沫儿笙3 小时前
库卡机器人铝工件焊接节气设备
人工智能·机器人
糖果店的幽灵3 小时前
【大模型】大模型学习总结之机器学习-3.模型评估
人工智能·学习·机器学习
石臻臻的杂货铺3 小时前
OpenClaw 大更新:插件市场上线,/btw 侧边提问,AI agent 从工具变成了平台
人工智能
步步为营DotNet3 小时前
解锁.NET 11 边缘计算潜力:基于Blazor与Native AOT的边缘应用开发
人工智能·.net·边缘计算
Data-Miner3 小时前
Excel-Agent:你的专属 AI 数据分析助手
人工智能·数据分析·excel
weixin_505154463 小时前
博维数孪,重塑3D作业指导新时代
人工智能·物联网·3d·智慧城市·数据安全·数字孪生
鼓掌MVP3 小时前
用 QClaw 创作宝可梦4格漫画的AI 创意应用实践
人工智能
随便写写3 小时前
第三章 索引构建
人工智能