26年春节AI发展大事记

引言

2026年的春节,或许会被日后的互联网史记为一个里程碑------中国互联网史上最大规模的AI用户启蒙,在不到两周内完成了。

数据是最直接的证据。11天内,用户对阿里千问App说了50亿次"千问帮我";除夕当天,字节豆包的AI互动总数达到19亿次;腾讯元宝则在分10亿红包的过程中,全网累计抽奖36亿次,促成用户完成AI创作任务超10亿次。在抢红包、免单优惠、春晚交互等玩法的驱动下,三家产品的日活和月活均创了新高,元宝的MAU突破1.14亿,豆包、元宝、千问加上DeepSeek,齐齐跻身"AI原生应用亿级俱乐部"。

这些数字意味着什么?AI已经从少数人手中的工具,变成了普通人日常生活的一部分。 对于我们这些互联网从业者来说,即使在非工作时间,也很难不去关注:在这样一个特殊的时间窗口里,AI又取得了怎样的进步。

按照法定节假日,26年春节假期是2月15日至23日,但部分公司实际放假更长。所以我们将目光聚焦在2月10日到2月24日这两周,看看这段时间里,AI领域到底发生了什么。

大事记总览

如下图:

短短两周,13起重大事件密集落地,覆盖模型发布、融资、产品迭代等多个维度。其密度之高,放在以往任何一个月来看都算得上壮观------而这仅仅是一个春节假期。

详细事件如下:

日期 事件 公司/组织 主要改动点
2/11 GLM-5 旗舰模型发布 智谱 AI 参数从 355B→744B;全程华为昇腾芯片训练,无 NVIDIA GPU;编程与 Agent 能力达开源 SOTA;HLE 评测 50.4% 全球第一,幻觉率仅 1.2%
2/12 Gemini 3 Deep Think 重大升级 Google 聚焦"系统2"深度推理;ARC-AGI-2 达 84.6%(远超 GPT-5.2 的 52.9%);IMO 金牌水平;Codeforces Elo 3455;可将手绘草图转为 3D 打印文件
2/12 M2.5 模型发布 MiniMax SWE-Bench Verified 80.2%;覆盖 10+ 语言的全栈开发(Web/Android/iOS/Windows);速度比 M2.1 快 37%;定价 $1/小时(100 tok/s),极致性价比
2/12 Seedance 2.0 视频模型发布 字节跳动 多模态混合输入(单次最多12个素材);2K 分辨率输出,可用率 90%+;15秒多镜头叙事+原生音画同步;双声道立体声+唇形同步
2/13 GPT-5.3-Codex-Spark(Cerebras 合作) OpenAI 基于 Cerebras WSE-3 芯片,推理速度 1000+ tok/s,比标准版快 15 倍;128K 上下文;轻量化实时编程优化;面向 ChatGPT Pro 用户
2/13 300 亿美元 G 轮融资 Anthropic 估值达 3800 亿美元,较半年前翻倍;GIC、Coatue 领投;年化收入 140 亿,同比 10 倍增长;Claude Code 贡献 25 亿+年化收入
2/13 GPT-4o 等旧模型正式下线 OpenAI GPT-4o、GPT-4.1、GPT-4.1 mini、o4-mini 从 ChatGPT 下线;GPT-5 (Instant/Thinking) 同步退役;用户自动迁移至 GPT-5.2;API 侧暂不受影响
2/14 豆包大模型 2.0 发布 字节跳动 含 Pro/Lite/Mini/Code 四版本;Pro 版 IMO、ICPC 金牌水平,超越 Gemini 3 Pro 和 GPT-5.2;多模态理解达 SOTA;推理成本降约一个数量级
2/16 Qwen 3.5 开源发布 阿里巴巴 MoE 架构 397B 总参/17B 激活;Apache 2.0 协议完全开源;256K 上下文(Plus 版 1M);支持 201 种语言;可处理 2 小时视频;吞吐量提升 8-19 倍
2/17 Claude Sonnet 4.6 发布 Anthropic 1M 上下文窗口(beta);最大输出 64K tokens;SWE-Bench 和 OSWorld 创新纪录;盲测中 59% 偏好胜过 Opus 4.5;定价不变 3/15 per M tokens;成为免费/Pro 默认模型
2/17 Grok 4.2 公测版发布 xAI 从单模型转为多 Agent 框架(协调器+研究+创意+逻辑 四个并行 Agent);支持"快速学习"每周迭代更新;显著降低幻觉率
2/19 Gemini 3.1 Pro 预览版发布 Google 1M 上下文窗口;最大输出 65K tokens;ARC-AGI-2 达 77.1%,推理性能比 Gemini 3 Pro 翻倍;支持文本/图像/视频/音频/PDF 多模态输入;已上线 GitHub Copilot

几个值得深入聊聊的事件

在这十几起事件中,我个人最为关注的是三个:Gemini 3.1 Pro preview发布Claude Sonnet 4.6发布 ,以及Seedance 2.0视频模型发布

Gemini 3.1 Pro preview & Claude Sonnet 4.6

把这两个放在一起说,是因为它们对我而言有着相同的实际意义------我目前负责的一个探索性工作,正是基于Claude Sonnet和Gemini系列来完成的,目前已经取得了不错的效果。这两个新模型的发布,让我对进一步提升效果有了更多期待。

从能力上看,两者都在推理能力上取得了显著突破。Gemini 3.1 Pro的ARC-AGI-2从前代翻倍达到77.1%,支持1M上下文窗口和多模态输入,并且已经上线GitHub Copilot,说明Google对这个版本的工程化信心很足。Claude Sonnet 4.6则在SWE-Bench和OSWorld上创了新纪录,盲测中59%的偏好率胜过自家旗舰Opus 4.5------这在Anthropic的产品线中是很少见的,一个Sonnet级别的模型在用户偏好上压过Opus,意味着** 够用且快 正在取代 最强但慢 成为实际工作中的最优选择**。

更值得注意的是定价策略。Sonnet 4.6保持3美刀 input token/15美刀 output token per M tokens不变,同时成为免费和Pro用户的默认模型。这个信号很明确:Anthropic希望让最好的模型触达最广的用户群,而不是把它藏在高价付费墙后面。

Seedance 2.0 视频模型

Seedance 2.0在正式发布前就已经引发了广泛关注。多模态混合输入(单次最多12个素材)、2K分辨率、90%以上的可用率、15秒多镜头叙事加原生音画同步------这些特性放在一起,几乎可以说是AI视频生成领域的一次划时代进步

过去AI生成视频最大的问题是"看起来像AI生成的":画面闪烁、物体变形、动作不连贯。Seedance 2.0在可用率上突破90%,双声道立体声配合唇形同步,意味着它离"可直接用于内容发布"的标准又近了一大步。

对于个人创作者来说,这无疑是一个巨大的机会。过去需要一整支团队和昂贵设备才能完成的视频制作工作,如今一个人加上一个好的创意,就可能产出有竞争力的内容。工具的门槛降低,从来都是创意繁荣的前奏。

其他值得关注的趋势

除了上述三个事件,这两周的密集发布中还有几个趋势值得留意:

国产大模型的独立路径正在成形。 智谱GLM-5全程使用华为昇腾芯片训练,完全绕开了NVIDIA GPU,这在当前的国际形势下具有重要的战略意义。HLE评测50.4%全球第一、幻觉率仅1.2%,证明这条路不仅走得通,而且走得好。

开源生态持续壮大。 阿里Qwen 3.5以Apache 2.0协议完全开源,397B总参数、256K上下文、201种语言支持------这样级别的模型开源,放在两年前是不可想象的。开源正在以一种不可逆的方式重塑整个AI生态。

旧时代的大门正在关闭。 OpenAI在春节期间下线了GPT-4o等一系列旧模型,用户自动迁移至GPT-5.2。一个以GPT-4为代表的时代正式落幕。模型迭代的速度之快,让人不禁感慨:在AI领域,半年就是一个世代。

Anthropic的商业化飞轮加速旋转。 300亿美元G轮融资,3800亿美元估值,年化收入140亿且同比增长10倍------其中Claude Code贡献了25亿以上的年化收入。这说明AI编程助手不再只是一个"未来的故事",它已经是一门实实在在的生意。

结语

回顾这两周,13起事件,涉及中美两国近10家公司和组织,横跨模型能力、视频生成、开源生态、商业融资等多个领域。每一件单独拿出来都值得写一篇深度分析,而它们偏偏挤在同一个春节假期里集中爆发。

这种密度本身就是一种信号:AI的竞赛已经进入了一个新的加速阶段。

对于从业者而言,保持关注和学习已经不再是"加分项",而是"必选项"。这个春节假期,有人在抢红包中第一次接触了AI,有人在走亲访友间隙刷到了Seedance 2.0的惊艳demo,也有人(比如我)一边吃着年夜饭一边盘算着新模型能给手头的项目带来多大的提升。

时代的浪潮不等人。好在这一次,我们不只是旁观者。