26年春节AI发展大事记

引言

2026年的春节，或许会被日后的互联网史记为一个里程碑------中国互联网史上最大规模的AI用户启蒙，在不到两周内完成了。

数据是最直接的证据。11天内，用户对阿里千问App说了50亿次"千问帮我"；除夕当天，字节豆包的AI互动总数达到19亿次；腾讯元宝则在分10亿红包的过程中，全网累计抽奖36亿次，促成用户完成AI创作任务超10亿次。在抢红包、免单优惠、春晚交互等玩法的驱动下，三家产品的日活和月活均创了新高，元宝的MAU突破1.14亿，豆包、元宝、千问加上DeepSeek，齐齐跻身"AI原生应用亿级俱乐部"。

这些数字意味着什么？AI已经从少数人手中的工具，变成了普通人日常生活的一部分。 对于我们这些互联网从业者来说，即使在非工作时间，也很难不去关注：在这样一个特殊的时间窗口里，AI又取得了怎样的进步。

按照法定节假日，26年春节假期是2月15日至23日，但部分公司实际放假更长。所以我们将目光聚焦在2月10日到2月24日这两周，看看这段时间里，AI领域到底发生了什么。

大事记总览

如下图：

短短两周，13起重大事件密集落地，覆盖模型发布、融资、产品迭代等多个维度。其密度之高，放在以往任何一个月来看都算得上壮观------而这仅仅是一个春节假期。

详细事件如下：

日期	事件	公司/组织	主要改动点
2/11	GLM-5 旗舰模型发布	智谱 AI	参数从 355B→744B；全程华为昇腾芯片训练，无 NVIDIA GPU；编程与 Agent 能力达开源 SOTA；HLE 评测 50.4% 全球第一，幻觉率仅 1.2%
2/12	Gemini 3 Deep Think 重大升级	Google	聚焦"系统2"深度推理；ARC-AGI-2 达 84.6%（远超 GPT-5.2 的 52.9%）；IMO 金牌水平；Codeforces Elo 3455；可将手绘草图转为 3D 打印文件
2/12	M2.5 模型发布	MiniMax	SWE-Bench Verified 80.2%；覆盖 10+ 语言的全栈开发（Web/Android/iOS/Windows）；速度比 M2.1 快 37%；定价 $1/小时（100 tok/s），极致性价比
2/12	Seedance 2.0 视频模型发布	字节跳动	多模态混合输入（单次最多12个素材）；2K 分辨率输出，可用率 90%+；15秒多镜头叙事+原生音画同步；双声道立体声+唇形同步
2/13	GPT-5.3-Codex-Spark（Cerebras 合作）	OpenAI	基于 Cerebras WSE-3 芯片，推理速度 1000+ tok/s，比标准版快 15 倍；128K 上下文；轻量化实时编程优化；面向 ChatGPT Pro 用户
2/13	300 亿美元 G 轮融资	Anthropic	估值达 3800 亿美元，较半年前翻倍；GIC、Coatue 领投；年化收入 140 亿，同比 10 倍增长；Claude Code 贡献 25 亿+年化收入
2/13	GPT-4o 等旧模型正式下线	OpenAI	GPT-4o、GPT-4.1、GPT-4.1 mini、o4-mini 从 ChatGPT 下线；GPT-5 (Instant/Thinking) 同步退役；用户自动迁移至 GPT-5.2；API 侧暂不受影响
2/14	豆包大模型 2.0 发布	字节跳动	含 Pro/Lite/Mini/Code 四版本；Pro 版 IMO、ICPC 金牌水平，超越 Gemini 3 Pro 和 GPT-5.2；多模态理解达 SOTA；推理成本降约一个数量级
2/16	Qwen 3.5 开源发布	阿里巴巴	MoE 架构 397B 总参/17B 激活；Apache 2.0 协议完全开源；256K 上下文（Plus 版 1M）；支持 201 种语言；可处理 2 小时视频；吞吐量提升 8-19 倍
2/17	Claude Sonnet 4.6 发布	Anthropic	1M 上下文窗口（beta）；最大输出 64K tokens；SWE-Bench 和 OSWorld 创新纪录；盲测中 59% 偏好胜过 Opus 4.5；定价不变 $3/$ 15 per M tokens；成为免费/Pro 默认模型
2/17	Grok 4.2 公测版发布	xAI	从单模型转为多 Agent 框架（协调器+研究+创意+逻辑四个并行 Agent）；支持"快速学习"每周迭代更新；显著降低幻觉率
2/19	Gemini 3.1 Pro 预览版发布	Google	1M 上下文窗口；最大输出 65K tokens；ARC-AGI-2 达 77.1%，推理性能比 Gemini 3 Pro 翻倍；支持文本/图像/视频/音频/PDF 多模态输入；已上线 GitHub Copilot

几个值得深入聊聊的事件

在这十几起事件中，我个人最为关注的是三个：Gemini 3.1 Pro preview发布 、Claude Sonnet 4.6发布 ，以及Seedance 2.0视频模型发布。

Gemini 3.1 Pro preview & Claude Sonnet 4.6

把这两个放在一起说，是因为它们对我而言有着相同的实际意义------我目前负责的一个探索性工作，正是基于Claude Sonnet和Gemini系列来完成的，目前已经取得了不错的效果。这两个新模型的发布，让我对进一步提升效果有了更多期待。

从能力上看，两者都在推理能力上取得了显著突破。Gemini 3.1 Pro的ARC-AGI-2从前代翻倍达到77.1%，支持1M上下文窗口和多模态输入，并且已经上线GitHub Copilot，说明Google对这个版本的工程化信心很足。Claude Sonnet 4.6则在SWE-Bench和OSWorld上创了新纪录，盲测中59%的偏好率胜过自家旗舰Opus 4.5------这在Anthropic的产品线中是很少见的，一个Sonnet级别的模型在用户偏好上压过Opus，意味着** 够用且快正在取代最强但慢成为实际工作中的最优选择**。

更值得注意的是定价策略。Sonnet 4.6保持3美刀 input token/15美刀 output token per M tokens不变，同时成为免费和Pro用户的默认模型。这个信号很明确：Anthropic希望让最好的模型触达最广的用户群，而不是把它藏在高价付费墙后面。

Seedance 2.0 视频模型

Seedance 2.0在正式发布前就已经引发了广泛关注。多模态混合输入（单次最多12个素材）、2K分辨率、90%以上的可用率、15秒多镜头叙事加原生音画同步------这些特性放在一起，几乎可以说是AI视频生成领域的一次划时代进步。

过去AI生成视频最大的问题是"看起来像AI生成的"：画面闪烁、物体变形、动作不连贯。Seedance 2.0在可用率上突破90%，双声道立体声配合唇形同步，意味着它离"可直接用于内容发布"的标准又近了一大步。

对于个人创作者来说，这无疑是一个巨大的机会。过去需要一整支团队和昂贵设备才能完成的视频制作工作，如今一个人加上一个好的创意，就可能产出有竞争力的内容。工具的门槛降低，从来都是创意繁荣的前奏。

其他值得关注的趋势

除了上述三个事件，这两周的密集发布中还有几个趋势值得留意：

国产大模型的独立路径正在成形。 智谱GLM-5全程使用华为昇腾芯片训练，完全绕开了NVIDIA GPU，这在当前的国际形势下具有重要的战略意义。HLE评测50.4%全球第一、幻觉率仅1.2%，证明这条路不仅走得通，而且走得好。

开源生态持续壮大。 阿里Qwen 3.5以Apache 2.0协议完全开源，397B总参数、256K上下文、201种语言支持------这样级别的模型开源，放在两年前是不可想象的。开源正在以一种不可逆的方式重塑整个AI生态。

旧时代的大门正在关闭。 OpenAI在春节期间下线了GPT-4o等一系列旧模型，用户自动迁移至GPT-5.2。一个以GPT-4为代表的时代正式落幕。模型迭代的速度之快，让人不禁感慨：在AI领域，半年就是一个世代。

Anthropic的商业化飞轮加速旋转。 300亿美元G轮融资，3800亿美元估值，年化收入140亿且同比增长10倍------其中Claude Code贡献了25亿以上的年化收入。这说明AI编程助手不再只是一个"未来的故事"，它已经是一门实实在在的生意。

结语

回顾这两周，13起事件，涉及中美两国近10家公司和组织，横跨模型能力、视频生成、开源生态、商业融资等多个领域。每一件单独拿出来都值得写一篇深度分析，而它们偏偏挤在同一个春节假期里集中爆发。

这种密度本身就是一种信号：AI的竞赛已经进入了一个新的加速阶段。

对于从业者而言，保持关注和学习已经不再是"加分项"，而是"必选项"。这个春节假期，有人在抢红包中第一次接触了AI，有人在走亲访友间隙刷到了Seedance 2.0的惊艳demo，也有人（比如我）一边吃着年夜饭一边盘算着新模型能给手头的项目带来多大的提升。

时代的浪潮不等人。好在这一次，我们不只是旁观者。