前言
从2025年春节的早晨阅读一篇关于 DeepSeek 的文章开始,我才意识到这世界马上、甚至已经天翻地覆。对这热潮随波逐流,至今已临近下一个年关,可见国内的创新亦是常有勃发,也该将学习历程回顾一番,以便来年急流勇进。本文以笔者浅见为主,从国内外大模型的关键技术节点出发,梳理每月的大事记,并附上 Q4 的《AI生产力再探再报》。让我们一起来瞅瞅,这一年里 AI 的发展与变化吧!~

一、每月大事记
1.一月:国产模型实现国际追赶,技术突破里程碑
2025年1月,大模型领域迎来了具有里程碑意义的技术突破。月之暗面发布的 Kimi-k1.5 和 深度求索 发布的 DeepSeek-R1 模型,分别从多模态思考和纯推理两个维度实现了对 OpenAI-o1 的追赶,标志着中国在大模型核心技术上取得了突破性进展。
2.二月:模型落地多场景,产业热度全面升温
月初,百度智能云千帆平台上线 DeepSeek R1 与 V3 模型,首日即有超 1.5 万家客户调用,随后,华为云、腾讯云跟进上线。春节后,A股开盘,DeepSeek 概念股集体上涨。吉利、东风、广汽等多家车企表示车机接入大模型,智能汽车进入"大模型+"新阶段。月末,河南工业大学宣布本地化部署"满血版DeepSeek",高校教育场景开始拥抱大模型技术。
3.三月:国内外头部密集发力,模型迭代提速
国内:百度发布文心4.5 和 X1 模型,阿里开源 QwQ-32B 推理模型,腾讯发布混元 T1 推理模型。
国外:谷歌发布 Gemma 3,可在单个 GPU 上运行,成为功能最强大的开源小模型之一。Anthropic 推出 Claude 3.7 Sonnet,在编程专项评测中断层式领先。
4.四月:开源热潮 + 多模态升级,行业规范落地
国内:Qwen2.5-Omni 登顶全球开源榜,支持多模态输入,在多项评测中超越 Meta 的 Llama3,标志着国产模型国际影响力跃升。DeepSeek 公布低成本训练方案,采用动态架构优化与稀疏训练技术,动摇行业对"算力即优势"的信仰。智谱AI向北京证监局提交上市辅导备案,有望成为"中国大模型第一股"。国家网信办公布 346 款生成式 AI 服务完成备案,未备案产品不得上线,推动行业规范化发展。
国外:OpenAI 宣布 GPT-4 退役,GPT-4o 正式上线,具备更强的多模态能力与实时交互体验,推理速度更快、成本更低。谷歌 Gemini 升级多模态功能:新增视频分析与图像搜索能力,强化办公与搜索场景应用。xAI 发布 Grok3,马斯克旗下公司加速产品化,丰富 AI 生态布局。
附 :
【2025年4月】AI 生产力工具,让牛马跑得更快!绘画、原型、编程、伴读、研报...还有什么做不到?
5.五月:技术迭代 + 生态筑基,资本监管双向发力
国内:阿里开源新一代混合推理模型 Qwen3,性能超越 DeepSeek-R1,持续镇守开源榜。DeepSeek-R1 完成 R1-0528 版本升级,基于V3 Base 模型优化后训练算法,显著提升推理深度与思维链能力,上下文长度翻倍至 128K,幻觉率降低 50%。工信部批准首个 AI 原生操作系统立项,由华为牵头,融合鸿蒙生态与大模型能力,为终端侧 AI 提供底层支持。
国外:OpenAI 重启400亿美元融资计划。SpaceX 向 xAI 投资 20 亿美元。苹果拟 485 亿美元收购法国 AI 独角兽 Mistral。欧盟委员会发布通用 AI 模型提供商指南。Linux 基金会等签署《国际人工智能开源合作倡议》
附 :
【2025年5月】AI生产力再探再报:各家智能体持续内卷,前沿应用不断细分
6.六月:模型百花齐放,应用与监管同步演进
国内:百度开源文心大模型 4.5 系列。腾讯发布首款混合推理 MoE 模型 Hunyuan-A13B。火山引擎发布豆包 1.6 及视频生成模型 Seedance1.0pro。MiniMax 发布 M1 模型。
国外:谷歌 DeepMind AI 辅助抗癌药物启动人体试验。美国商务部重组 AI 安全研究所,移除"安全"一词,引发对 AI 监管方向调整的关注。
附 :
【2025年6月】AI生产力再探再报:更多更强的超级智能体,统计、调研、PPT、前端开发、控制电脑!还有干饭
7.七月:分层竞争深化,技术深耕多领域
国内:阿里开源周发布 Qwen3-Coder、Wan2.2 等重磅模型。腾讯全球首发开源"混元3D世界模型"。智谱发布 GLM-4.5。
国外:xAI 发布 Grok4,同步推出 AI 伴侣 Ani。谷歌 Gemini 模型获国际数学奥赛金牌。
附 :
【2025年7月】AI生产力再探再报:AI 女友来啦~顶级开源项目井喷,好物太多了!
8.八月:Agent 成核心方向,架构创新与流量争夺并行
国内:DeepSeek 发布 V3.1 模型,采用混合推理架构,提升思考效率与任务规划能力。阿里发布 Agentic 编程平台 Qoder。
国外:OpenAI 正式发布 GPT-5,其动态路由架构实现了自动分配任务至基础模型(快速响应)或思考模型(复杂推理)。谷歌发布 Gemini 2.5 Pro。xAI 开源 Grok 2.5。Perplexity 提出收购 Chrome 浏览器,虽未被接受,但凸显 AI 企业对流量入口的争夺。
9.九月:模型性能再突破,国内外新品密集发布
国内:阿里发布 Qwen3-Max、Qwen3-VL 和 Wan2.5 。月之暗面发布 Kimi-K2。深度求索发布 DeepSeek-V3.2
国外:Anthropic 发布 Claude 4。Meta 发布 Llama 3.1
附 :
【2025年Q3】AI生产力再探再报:社恐专用写作、动嘴剪视频、AI点外卖?这波AI工具太野了!
10.十月:架构创新涌现,视觉与 Agent 技术落地
国内:深度求索开源 DeepSeek-OCR。智谱开源视觉 Token 方案 Glyph。百度开源 PaddleOCR-VL。MiniMax 开源 M2 模型。
国外:Anthropic 发布 AI Agent 上下文工程指南。OpenAI 发布首个浏览器 ChatGPT Atlas。
11.十一月:聚焦整合,探索下一代优化方向
国内 :腾讯开源混元OCR。阿里开源 Z-Image。百度发布文心5.0原生全模态模型,首个支持理解、生成、推理、创作全模态内容的大模型。
国外:谷歌发布 Gemini 3 Pro,此即未来。谷歌发表论文:《Nested Learning: The Illusion of Deep Learning Architectures》,谷歌发布 Nano-Banana 的首个官方教程:《The Complete Guide to Nano Banana Pro: 10 Tips for Professional Asset Production》。
12.十二月:移动端智能体爆发,终端 AI 生态初显
国内:豆包发售 AI 手机,发布 Seedream 4.5 和 Seedance 1.5 pro。阿里开源 Mobile-Agent。腾讯开源 AppAgent。智谱开源 Auto-GLM,发布 GLM-4.7。小米开源 MiMo-V2-Flash。BOSS直聘开源 Nanbeige4-3B。蚂蚁集团与人大、浙大、西湖大学联合团队发布首个 100B 扩散语言模型 LLaDA2.0。深度求索开源 DeepSeekMath-V2。MiniMax 发布 M2.1 模型。
国外:Meta 收购 Manus。
13.年度小结:从架构创新到能力跃迁
核心技术层面,多模态技术从 "拼接式" 转向 "原生融合",MoE 架构成为主流,通过稀疏激活技术破解规模与效率矛盾;AI Agent 商业化爆发,具备 "感知 - 规划 - 行动" 闭环能力。国产模型表现亮眼,Qwen、DeepSeek 等占据全球开源模型榜单,低成本训练方案、全模态能力等关键技术打破垄断,与国际顶尖水平差距大幅缩小。
产业格局方面,分层竞争与生态收敛并行。国内市场从 "百模大战" 转向 "垂直收敛",全球层面是闭源与开源阵营分庭抗礼。资本聚焦核心资产,融资、收购动作频发,技术分工日趋明确。
附 Nano Banana 总结时间轴:

二、商业与资本市场浅析
1. 国内AI独角兽:MiniMax & 智谱AI
主导逻辑:资本化验证与上市冲刺
2025年,中国 AI 大模型行业进入了"商业化验证"与"资本市场博弈"的双重赛道。
| 公司 | 核心活动 | 关键数据/进程 |
|---|---|---|
| MiniMax (主C端) | 连环融资 & 上市冲刺 MiniMax在2025年完成了多轮关键融资,并加速了上市进程。 | • 2025年7月,MiniMax完成近3亿美元 (约22亿元人民币)新一轮融资,投后估值超过40亿美元 (约300亿元人民币)。 • 计划在2025年下半年至2026年初进行IPO(A股或港股均在筹备中),其中港股招股书已于12月递交,计划募资约3亿美元。 |
| 智谱AI (主B端) | 启动IPO进程 & 市值争夺 作为国内首家启动IPO的大模型公司,智谱AI在2025年完成了关键的上市辅导备案。 | • 2025年4月,智谱AI正式在北京证监局办理上市辅导备案,开启了IPO进程。 • 2025年12月,智谱AI递交了港股招股书并通过聆讯,计划募资约3亿美元,估值突破500亿港元,被视为"全球大模型第一股"的有力竞争者。 |
2. 国际AI巨头:Meta
主导逻辑:人才与技术的"天价"争夺战
2025年,Meta 的战略重点明显转向了对 AI 顶尖人才的争夺与"超级智能"实验室的组建。
| 事件 | 关键细节 |
|---|---|
| 高薪挖角 | Meta在2025年多次被报道以天价签约金 或高额薪酬挖角OpenAI和谷歌等竞争对手的核心研究员。 • 多次传闻Meta为挖角OpenAI的核心研究员(如Mark Chen)开出了1亿美元 级别的签约奖金。 • 7月,Meta成功挖角了苹果AI基础模型团队负责人,签约方案涉及2亿美元 的高额薪酬。 • 这些行为导致了行业内部的"人才抢夺战",甚至引发了OpenAI内部的强烈反击。 |
| 超级智能实验室 | 为了在AI竞争中逆袭,Meta加大了对超级智能实验室(MSL)的投入,试图从"普通AI"向"通用人工智能"迈进。 • 在高额挖角的同时,Meta还在收购Scale AI、Manus等公司,试图通过资本与人才双管齐下来加速研发。 |
三、2025年Q4 AI生产力再探再报
1.工具尝鲜快报
好玩的,初探感觉不错,但还未十分深入的工具。
1.1 MiniMax M2.1专业模式
奔着当今最强开源编码模型的宣传订阅了 1 个月,不过还没开始用其编码功能,其他通用任务表现尚可。
1.2 Kimi OK Computer
与上相似的通用 Agent 产品,包括很早之前的纳米AI等等,这类产品形式看着都是和 Manus 一个板式呀 = 。=,左边对话+右边虚拟机展示过程,难道这是最佳范式了?
1.3 GLM-4.6/4.7
订阅了季度的 Coding Lite,在 Claude code 中体验了一番,然后就忘了!直到 4.7 发布才发现马上就过期了...大概是笔者还没有完全信任单一的 AI,并且也喜欢自己先理解学习了再操作,所以还是习惯性跑去浏览器里打开各大官网来对比使用了。在编程方面,笔者主要是在 DeepSeek、Qwen、GLM 三者之间切换,虽然装了 Trae 、 Qoder 和 CodeBuddy,但仍很少直接在 IDE 中使用,接下来要好好感受一下主流 Vibe Coding 的灵魂才行!
2.生产力军火库
好用的,开箱即用的神器,或一些隐藏的技巧。
2.1 神中神:Nano Banana
一年以来使用各种 AI 产品都是在白嫖,不得不说小香蕉在生图领域的强大是断档的领先,令笔者在 Flowith 里充值了(120/月!虽然 2W 点我根本就用不完...而且有 GPT 等很多其他模型可选,不止是生图)。趣味性P图玩法就不说了,要说生产力还得是用来梳理知识的信息图,前文已经展示了它的能力,辅助自学也好,演示汇报也好,无敌!
下面是用 天赋挖掘机Agent 将笔者自我剖析总结后丢给 Banana 生成的信息图(生图提示词见笔者的上一篇文章):

2.2 豆包自建 Agent
许多平台都提供自建 Agent 功能,设置系统提示词、MCP等等。豆包的虽然可配置参数很少,但是创建的 Agent 指令遵从能力很不错,分享几个笔者创建的,点击名称直达体验:
通过深层次的心理对话,挖掘自己从小到大的天赋闪光点,最终形成深度总结报告。使用 数字生命卡兹克 大佬的提示词,大概会问 5 个左右的问题。


仿 ChatGPT Study 模式,说出你想学习的知识,AI 将会循序渐进引导你掌握。
强化版学习助手,会把你的自主思考能力榨干,直到你求饶说不学了。
2.3 随时问:灵光APP
极简的交互界面,一切只为引出灵感的下一步而生。输出遵循总-分-总 的卡片板式,易于阅读,可快速捕捉重点,其 闪应用 有时也会有惊喜。现在,笔者琐碎的突发奇想都会丢给灵光,随时想,随时问,在不需要深度研究时,比各种 AI 搜索产品都好用。

另外,PC端的同类产品,秘塔AI 的 好看 模式输出形式也不错。
3.前沿动态回顾
好看的,个人感兴趣的新工具、动态信息,或一些优质资料。
Github项目:
开源浏览器自动化 Agent:Nanobrowser
谷歌开源 Chrome 开发者工具 MCP:Chrome DevTools MCP
谷歌开源时间序列预测模型:TimesFM
清华和人大联合开发的开源数据分析 Agent :DeepAnalyze
开源舆情分析 Agent:BettaFish
开源智能图表生成工具:Smart Excalidraw
开源大模型议会 Agent:llm-council
清华 THUNLP、东北大学 NEUIR、OpenBMB 等多方联合推出的开源 RAG 框架:UltraRAG
微软开源智能体优化框架:Agent Lightning
开源流程图 Agent:next-ai-draw-io
开源 PPT Agent:banana-slides
Claude 开发快速入门
NotebookLM 开源替代:open-notebook
公众号文章:
你所有的人生卡点,都藏着你的恐惧!
高中辍学闯进 OpenAI:拒绝Vibe Coding,用 ChatGPT 自学逆袭成 Sora 团队研究科学家
亲手给AI投毒之后,我觉得整个互联网都变成了一座黑暗森林
Paper2Slides:一条命令,论文/报告/文档转换为PPT或posters
Lovart-AI设计拐点已来,还有独家编辑能力,直接起飞
Claude Opus 4.5 的灵魂文档被人逆向提取!Anthropic 负责人承认属实
关于智能体(AI Agent)搭建,Dify、n8n、Coze 超详细的总结!
后记
AI 似乎改变了一切,又似乎什么也没有改变。这里是思前想后的 Seon塞翁,学的不深、用的不多,先享受过程吧~下一篇见!