2025年AI大事记：从 DeepSeek R1 到 MiniMax M2.1，我们改变了什么？

前言

从2025年春节的早晨阅读一篇关于 DeepSeek 的文章开始，我才意识到这世界马上、甚至已经天翻地覆。对这热潮随波逐流，至今已临近下一个年关，可见国内的创新亦是常有勃发，也该将学习历程回顾一番，以便来年急流勇进。本文以笔者浅见为主，从国内外大模型的关键技术节点出发，梳理每月的大事记，并附上 Q4 的《AI生产力再探再报》。让我们一起来瞅瞅，这一年里 AI 的发展与变化吧！~

一、每月大事记

1.一月：国产模型实现国际追赶，技术突破里程碑

2025年1月，大模型领域迎来了具有里程碑意义的技术突破。月之暗面发布的 Kimi-k1.5 和深度求索发布的 DeepSeek-R1 模型，分别从多模态思考和纯推理两个维度实现了对 OpenAI-o1 的追赶，标志着中国在大模型核心技术上取得了突破性进展。

2.二月：模型落地多场景，产业热度全面升温

月初，百度智能云千帆平台上线 DeepSeek R1 与 V3 模型，首日即有超 1.5 万家客户调用，随后，华为云、腾讯云跟进上线。春节后，A股开盘，DeepSeek 概念股集体上涨。吉利、东风、广汽等多家车企表示车机接入大模型，智能汽车进入"大模型+"新阶段。月末，河南工业大学宣布本地化部署"满血版DeepSeek"，高校教育场景开始拥抱大模型技术。

3.三月：国内外头部密集发力，模型迭代提速

国内：百度发布文心4.5 和 X1 模型，阿里开源 QwQ-32B 推理模型，腾讯发布混元 T1 推理模型。

国外：谷歌发布 Gemma 3，可在单个 GPU 上运行，成为功能最强大的开源小模型之一。Anthropic 推出 Claude 3.7 Sonnet，在编程专项评测中断层式领先。

附：
2025年Q1 AI 学习应用总结

4.四月：开源热潮 + 多模态升级，行业规范落地

国内：Qwen2.5-Omni 登顶全球开源榜，支持多模态输入，在多项评测中超越 Meta 的 Llama3，标志着国产模型国际影响力跃升。DeepSeek 公布低成本训练方案，采用动态架构优化与稀疏训练技术，动摇行业对"算力即优势"的信仰。智谱AI向北京证监局提交上市辅导备案，有望成为"中国大模型第一股"。国家网信办公布 346 款生成式 AI 服务完成备案，未备案产品不得上线，推动行业规范化发展。

国外：OpenAI 宣布 GPT-4 退役，GPT-4o 正式上线，具备更强的多模态能力与实时交互体验，推理速度更快、成本更低。谷歌 Gemini 升级多模态功能：新增视频分析与图像搜索能力，强化办公与搜索场景应用。xAI 发布 Grok3，马斯克旗下公司加速产品化，丰富 AI 生态布局。

附：
【2025年4月】AI 生产力工具，让牛马跑得更快！绘画、原型、编程、伴读、研报...还有什么做不到？

5.五月：技术迭代 + 生态筑基，资本监管双向发力

国内：阿里开源新一代混合推理模型 Qwen3，性能超越 DeepSeek-R1，持续镇守开源榜。DeepSeek-R1 完成 R1-0528 版本升级，基于V3 Base 模型优化后训练算法，显著提升推理深度与思维链能力，上下文长度翻倍至 128K，幻觉率降低 50%。工信部批准首个 AI 原生操作系统立项，由华为牵头，融合鸿蒙生态与大模型能力，为终端侧 AI 提供底层支持。

国外：OpenAI 重启400亿美元融资计划。SpaceX 向 xAI 投资 20 亿美元。苹果拟 485 亿美元收购法国 AI 独角兽 Mistral。欧盟委员会发布通用 AI 模型提供商指南。Linux 基金会等签署《国际人工智能开源合作倡议》

附：
【2025年5月】AI生产力再探再报：各家智能体持续内卷，前沿应用不断细分

6.六月：模型百花齐放，应用与监管同步演进

国内：百度开源文心大模型 4.5 系列。腾讯发布首款混合推理 MoE 模型 Hunyuan-A13B。火山引擎发布豆包 1.6 及视频生成模型 Seedance1.0pro。MiniMax 发布 M1 模型。

国外：谷歌 DeepMind AI 辅助抗癌药物启动人体试验。美国商务部重组 AI 安全研究所，移除"安全"一词，引发对 AI 监管方向调整的关注。

附：
【2025年6月】AI生产力再探再报：更多更强的超级智能体，统计、调研、PPT、前端开发、控制电脑！还有干饭

7.七月：分层竞争深化，技术深耕多领域

国内：阿里开源周发布 Qwen3-Coder、Wan2.2 等重磅模型。腾讯全球首发开源"混元3D世界模型"。智谱发布 GLM-4.5。

国外：xAI 发布 Grok4，同步推出 AI 伴侣 Ani。谷歌 Gemini 模型获国际数学奥赛金牌。

附：
【2025年7月】AI生产力再探再报：AI 女友来啦~顶级开源项目井喷，好物太多了！

8.八月：Agent 成核心方向，架构创新与流量争夺并行

国内：DeepSeek 发布 V3.1 模型，采用混合推理架构，提升思考效率与任务规划能力。阿里发布 Agentic 编程平台 Qoder。

国外：OpenAI 正式发布 GPT-5，其动态路由架构实现了自动分配任务至基础模型（快速响应）或思考模型（复杂推理）。谷歌发布 Gemini 2.5 Pro。xAI 开源 Grok 2.5。Perplexity 提出收购 Chrome 浏览器，虽未被接受，但凸显 AI 企业对流量入口的争夺。

9.九月：模型性能再突破，国内外新品密集发布

国内：阿里发布 Qwen3-Max、Qwen3-VL 和 Wan2.5 。月之暗面发布 Kimi-K2。深度求索发布 DeepSeek-V3.2

国外：Anthropic 发布 Claude 4。Meta 发布 Llama 3.1

附：
【2025年Q3】AI生产力再探再报：社恐专用写作、动嘴剪视频、AI点外卖？这波AI工具太野了！

10.十月：架构创新涌现，视觉与 Agent 技术落地

国内：深度求索开源 DeepSeek-OCR。智谱开源视觉 Token 方案 Glyph。百度开源 PaddleOCR-VL。MiniMax 开源 M2 模型。

国外：Anthropic 发布 AI Agent 上下文工程指南。OpenAI 发布首个浏览器 ChatGPT Atlas。

11.十一月：聚焦整合，探索下一代优化方向

国内：腾讯开源混元OCR。阿里开源 Z-Image。百度发布文心5.0原生全模态模型，首个支持理解、生成、推理、创作全模态内容的大模型。
国外：谷歌发布 Gemini 3 Pro，此即未来。谷歌发表论文：《Nested Learning: The Illusion of Deep Learning Architectures》，谷歌发布 Nano-Banana 的首个官方教程：《The Complete Guide to Nano Banana Pro: 10 Tips for Professional Asset Production》。

12.十二月：移动端智能体爆发，终端 AI 生态初显

国内：豆包发售 AI 手机，发布 Seedream 4.5 和 Seedance 1.5 pro。阿里开源 Mobile-Agent。腾讯开源 AppAgent。智谱开源 Auto-GLM，发布 GLM-4.7。小米开源 MiMo-V2-Flash。BOSS直聘开源 Nanbeige4-3B。蚂蚁集团与人大、浙大、西湖大学联合团队发布首个 100B 扩散语言模型 LLaDA2.0。深度求索开源 DeepSeekMath-V2。MiniMax 发布 M2.1 模型。

国外：Meta 收购 Manus。

13.年度小结：从架构创新到能力跃迁

核心技术层面，多模态技术从 "拼接式" 转向 "原生融合"，MoE 架构成为主流，通过稀疏激活技术破解规模与效率矛盾；AI Agent 商业化爆发，具备 "感知 - 规划 - 行动" 闭环能力。国产模型表现亮眼，Qwen、DeepSeek 等占据全球开源模型榜单，低成本训练方案、全模态能力等关键技术打破垄断，与国际顶尖水平差距大幅缩小。

产业格局方面，分层竞争与生态收敛并行。国内市场从 "百模大战" 转向 "垂直收敛"，全球层面是闭源与开源阵营分庭抗礼。资本聚焦核心资产，融资、收购动作频发，技术分工日趋明确。

附 Nano Banana 总结时间轴：

二、商业与资本市场浅析

1. 国内AI独角兽：MiniMax & 智谱AI

主导逻辑：资本化验证与上市冲刺

2025年，中国 AI 大模型行业进入了"商业化验证"与"资本市场博弈"的双重赛道。

公司	核心活动	关键数据/进程
MiniMax （主C端）	连环融资 & 上市冲刺 MiniMax在2025年完成了多轮关键融资，并加速了上市进程。	• 2025年7月，MiniMax完成近3亿美元（约22亿元人民币）新一轮融资，投后估值超过40亿美元（约300亿元人民币）。 • 计划在2025年下半年至2026年初进行IPO（A股或港股均在筹备中），其中港股招股书已于12月递交，计划募资约3亿美元。
智谱AI (主B端)	启动IPO进程 & 市值争夺作为国内首家启动IPO的大模型公司，智谱AI在2025年完成了关键的上市辅导备案。	• 2025年4月，智谱AI正式在北京证监局办理上市辅导备案，开启了IPO进程。 • 2025年12月，智谱AI递交了港股招股书并通过聆讯，计划募资约3亿美元，估值突破500亿港元，被视为"全球大模型第一股"的有力竞争者。

2. 国际AI巨头：Meta

主导逻辑：人才与技术的"天价"争夺战

2025年，Meta 的战略重点明显转向了对 AI 顶尖人才的争夺与"超级智能"实验室的组建。

事件	关键细节
高薪挖角	Meta在2025年多次被报道以天价签约金或高额薪酬挖角OpenAI和谷歌等竞争对手的核心研究员。 • 多次传闻Meta为挖角OpenAI的核心研究员（如Mark Chen）开出了1亿美元级别的签约奖金。 • 7月，Meta成功挖角了苹果AI基础模型团队负责人，签约方案涉及2亿美元的高额薪酬。 • 这些行为导致了行业内部的"人才抢夺战"，甚至引发了OpenAI内部的强烈反击。
超级智能实验室	为了在AI竞争中逆袭，Meta加大了对超级智能实验室（MSL）的投入，试图从"普通AI"向"通用人工智能"迈进。 • 在高额挖角的同时，Meta还在收购Scale AI、Manus等公司，试图通过资本与人才双管齐下来加速研发。

事件

关键细节

高薪挖角

Meta在2025年多次被报道以天价签约金 或高额薪酬挖角OpenAI和谷歌等竞争对手的核心研究员。 • 多次传闻Meta为挖角OpenAI的核心研究员（如Mark Chen）开出了1亿美元 级别的签约奖金。 • 7月，Meta成功挖角了苹果AI基础模型团队负责人，签约方案涉及2亿美元 的高额薪酬。 • 这些行为导致了行业内部的"人才抢夺战"，甚至引发了OpenAI内部的强烈反击。

超级智能实验室

为了在AI竞争中逆袭，Meta加大了对超级智能实验室（MSL）的投入，试图从"普通AI"向"通用人工智能"迈进。 • 在高额挖角的同时，Meta还在收购Scale AI、Manus等公司，试图通过资本与人才双管齐下来加速研发。

三、2025年Q4 AI生产力再探再报

1.工具尝鲜快报

好玩的，初探感觉不错，但还未十分深入的工具。

1.1 MiniMax M2.1专业模式

奔着当今最强开源编码模型的宣传订阅了 1 个月，不过还没开始用其编码功能，其他通用任务表现尚可。

1.2 Kimi OK Computer

与上相似的通用 Agent 产品，包括很早之前的纳米AI等等，这类产品形式看着都是和 Manus 一个板式呀 = 。=，左边对话+右边虚拟机展示过程，难道这是最佳范式了？

1.3 GLM-4.6/4.7

订阅了季度的 Coding Lite，在 Claude code 中体验了一番，然后就忘了！直到 4.7 发布才发现马上就过期了...大概是笔者还没有完全信任单一的 AI，并且也喜欢自己先理解学习了再操作，所以还是习惯性跑去浏览器里打开各大官网来对比使用了。在编程方面，笔者主要是在 DeepSeek、Qwen、GLM 三者之间切换，虽然装了 Trae 、 Qoder 和 CodeBuddy，但仍很少直接在 IDE 中使用，接下来要好好感受一下主流 Vibe Coding 的灵魂才行！

2.生产力军火库

好用的，开箱即用的神器，或一些隐藏的技巧。

2.1 神中神：Nano Banana

一年以来使用各种 AI 产品都是在白嫖，不得不说小香蕉在生图领域的强大是断档的领先，令笔者在 Flowith 里充值了（120/月！虽然 2W 点我根本就用不完...而且有 GPT 等很多其他模型可选，不止是生图）。趣味性P图玩法就不说了，要说生产力还得是用来梳理知识的信息图，前文已经展示了它的能力，辅助自学也好，演示汇报也好，无敌！

下面是用 天赋挖掘机Agent 将笔者自我剖析总结后丢给 Banana 生成的信息图（生图提示词见笔者的上一篇文章）：