目录
[第1章 为什么"最新视频压缩"不再只是换个编码器那么简单](#第1章 为什么“最新视频压缩”不再只是换个编码器那么简单)
[第2章 传统通用编码路线的"最新答案":H.266/VVC为什么被认为是HEVC之后的最大跃迁](#第2章 传统通用编码路线的“最新答案”:H.266/VVC为什么被认为是HEVC之后的最大跃迁)
[第3章 开放生态的"最新主线":AV1已规模化,AV2把下一轮竞争提前到了"标准定稿之前"](#第3章 开放生态的“最新主线”:AV1已规模化,AV2把下一轮竞争提前到了“标准定稿之前”)
[第4章 许可与可控性:MPEG-5 EVC把"专利风险管理"写进了标准设计逻辑](#第4章 许可与可控性:MPEG-5 EVC把“专利风险管理”写进了标准设计逻辑)
[第5章 "增强层"这条路线重新变热:MPEG-5 LCEVC把效率与复杂度拆开卖](#第5章 “增强层”这条路线重新变热:MPEG-5 LCEVC把效率与复杂度拆开卖)
[第6章 AI进入编码:从"论文里的神经压缩"走向"JVET在讨论的NNVC/ECM混合"](#第6章 AI进入编码:从“论文里的神经压缩”走向“JVET在讨论的NNVC/ECM混合”)
[第7章 不只为人眼:VCM把"机器视觉任务"纳入压缩目标,重新定义什么叫"有效码率"](#第7章 不只为人眼:VCM把“机器视觉任务”纳入压缩目标,重新定义什么叫“有效码率”)
[第8章 现实世界怎么选:编码效率、硬件覆盖、HDR与平台策略把"最新技术"拉回工程地面](#第8章 现实世界怎么选:编码效率、硬件覆盖、HDR与平台策略把“最新技术”拉回工程地面)
第1章 为什么"最新视频压缩"不再只是换个编码器那么简单
过去十几年里,行业谈视频压缩往往就是"从H.264升级到HEVC/AV1,再往后看VVC"。但到了近两年,"最新"这件事的含义明显变了:一方面,传统"块基+运动补偿+变换+熵编码"的路线仍在推进,ITU-T/ISO 的 H.266/VVC 作为新一代通用标准已经正式发布并持续迭代,目标是在相同主观质量下显著降低码率;另一方面,开放媒体联盟 AOMedia 的 AV1 已经进入大规模生产部署阶段,并且其下一代 AV2 也公开宣布将于 2025 年底完成标准发布计划,让"开源生态+硬件普及+规模化编码运营"的路线开始影响主流策略选择;更重要的是,标准组织正在认真讨论"神经网络编码(NNVC)"与"面向机器视觉的视频编码(VCM)"这类新方向,它们不再只服务"人眼观看",而是把"机器理解"也纳入压缩目标的一部分。ITU 与 ISO/IEC 的联合研讨会公开提到,JVET 正在探索 NNVC 与更传统压缩方式,并开发了 enhanced compression model(ECM)以及 NNVC/ECM 的混合方案,这种表述本身就说明"AI进入编码工具箱"已经不是单纯的论文概念,而是标准化讨论的一部分。(ITU)
当你站在 2026 年初回看,会发现"最新视频压缩技术"的竞争点被拆成了几条同时进行的战线:压缩效率(同画质更省带宽)、编解码复杂度(算力与电费)、授权与专利风险(能否大规模商用)、以及生态落地速度(芯片、浏览器、电视、手机、云转码链路)。这篇综述想做的不是"给你一串编码器名单",而是把这些战线如何互相牵制、以及每条路线的现实进度,用可核对的公开资料串起来。
第2章 传统通用编码路线的"最新答案":H.266/VVC为什么被认为是HEVC之后的最大跃迁
在传统视频编码路线里,H.266/VVC(Versatile Video Coding)最常被引用的一句话是"相对H.265/HEVC在相同主观质量下约50%码率节省"。这个量级的提升并不是坊间夸张宣传,而是 Fraunhofer HHI 在其技术页面上明确写出的定位:VVC 相比 HEVC 约可实现 50% 的比特率降低,同时覆盖广泛内容与应用场景。(弗劳恩霍夫赫尔姆生物技术研究所) 另外,ITU 的推荐书目页也能核对到 H.266 的正式文档条目:Recommendation H.266(08/20)在 2020-08-29 获批,并以 ITU-T 推荐的形式发布。(ITU)
但"更省带宽"只是故事的一半。VVC 之所以被称为"通用(versatile)",在于它把应用场景扩展得很彻底:从传统自然视频到屏幕内容、从超高清到更复杂的沉浸式媒体,都希望在同一代标准里找到工具组合。对工程团队来说,VVC带来的挑战往往不在"是否能编码",而在"是否算得起、是否能大规模部署":更复杂的工具意味着更高的编码算力成本、更长的转码队列时间,以及更高的端侧硬解码门槛。也正因为如此,VVC在产业落地上通常会先出现在对带宽极敏感、对画质要求极高、且更愿意为新硬件付费的场景里(例如高端电视与特定分发链路),而不是一夜之间替代掉所有在线流媒体的主力格式。
第3章 开放生态的"最新主线":AV1已规模化,AV2把下一轮竞争提前到了"标准定稿之前"
与 VVC 这条"传统标准组织+专利许可"路线并行推进的,是 AOMedia 主导的开放视频编码路线。AV1 的现实意义在 2024--2025 年间变得非常具体:AOMedia 在其 adoption showcase 的新闻稿里直接给出了极具冲击力的部署数据------"约95%的 Netflix 目录已用 AV1 编码""YouTube(按观看时长计)超过50%的目录可用 AV1""Meta Reels(iOS,按观看时长计)超过70%使用 AV1"。(Alliance for Open Media) 这些数字之所以重要,是因为它们意味着 AV1 不再是"实验室里更省码率的候选",而是进入了真实的海量内容生产、分发与播放链路,并且与芯片/浏览器/应用端的兼容性一起形成了正循环。
而"最新"的变化在于 AV2。AOMedia 在其10周年相关的新闻稿中公开提到,下一代视频编码标准 AV2 计划在"今年年底完成最终定稿(finalization later this year)",并披露了成员调研中"53%计划在定稿后12个月内采用、88%预计两年内实施"的意向数据。(Alliance for Open Media) 同期的中文媒体报道也复述了 AOMedia 关于"2025年底发布AV2标准"的公开表述。(腾讯新闻) 对产业链而言,这意味着一个很现实的时间窗口:当 AV2 还未完全尘埃落定时,大平台已经在规划"编码侧怎么切换、硬件侧怎么演进、以及如何在多编码并存时期维持播放覆盖"。也因此,2026年的"最新压缩技术"讨论,越来越像"多编码共存的策略问题",而不是"选一个最强编码器就完事"。
第4章 许可与可控性:MPEG-5 EVC把"专利风险管理"写进了标准设计逻辑
如果说 VVC 与 AV1/AV2 分别代表了两种典型路线,那么 MPEG-5 EVC(Essential Video Coding)更像是把"授权不确定性"当作核心需求来处理的一种尝试。至少从标准文本的公开入口来看,它确实是被 ISO 以正式标准的方式发布:ISO 页面显示 ISO/IEC 23094-1:2020 对应 EVC,并说明该文档规定了"essential video coding(EVC)"的语法、语义与解码过程,同时以 profile/level/toolset 的方式限定解码能力集合。(国际标准化组织) 在更通俗的公开解释里,EVC 通常被描述为由一个"更可控授权风险的基础工具集"加上"可选择的增强工具"构成,这种结构的工程意义在于:同一套标准允许你在不同商业策略下做不同取舍------有的团队可能优先选择"更低风险的基础子集",有的团队则愿意为更高压缩效率承担更复杂的许可谈判。
需要强调的是,EVC 在实际主流流媒体里的声量显著小于 AV1/HEVC/VVC,这并不必然说明技术不行,而更多反映了生态惯性:平台端需要"编码器实现成熟、端侧硬解普及、内容工具链完善、以及授权路径清晰"。EVC 的价值更像是给行业提供了一种"标准层面的可组合许可思路",在多方博弈里提供新的选择空间。
第5章 "增强层"这条路线重新变热:MPEG-5 LCEVC把效率与复杂度拆开卖
当算力、电费与碳排成为视频平台不可忽视的成本项时,一条看似"非主流"的路线重新被认真讨论:不一定非要让基础编码器自己变得更复杂,而是用一个低复杂度的"增强层"去提升既有编码器的表现,这就是 MPEG-5 Part 2 LCEVC(Low Complexity Enhancement Video Coding)的基本思路。它在 ISO 标准库中同样有明确入口:ISO/IEC 23094-2:2021 被描述为"低复杂度增强视频编码",处于已发布(Published)的国际标准状态。(国际标准化组织)
在产业传播层面,LCEVC常被强调的卖点是:它可以与"一个单独的基础编码器"组合,形成增强视频流,从而在保留基础编码生态的同时提升效果;而在商业化推进上,也能看到围绕 LCEVC 的许可与落地动作。例如 TVTechnology 的报道提到,V-Nova 推出了面向分发服务与终端设备的 LCEVC 许可方案,并在报道中给出了"可提升压缩效率、降低转码成本与能耗"的市场叙事。(TV Tech) 你不必把这些数字当作"对所有内容都恒真"的工程结论,但它们确实反映了一个趋势:当主力编码器切换成本太高时,"增强层+存量生态"会变成更现实的优化路径,尤其适合那些既要节省带宽又不想立刻全量升级端侧硬件的场景。
第6章 AI进入编码:从"论文里的神经压缩"走向"JVET在讨论的NNVC/ECM混合"
"神经网络视频压缩"这几年一直很热,但真正值得关注的分水岭是:它开始以更正式的方式进入标准化讨论。ITU 的联合研讨会页面明确指出,JVET 已在探索 Neural Network-based Video Coding(NNVC)以及更传统的压缩方法,并开发了 enhanced compression model(ECM)以及 NNVC 与 ECM 的混合方案。(ITU) 这类表述意味着一个更务实的方向:短期内,行业更可能采用"混合式神经工具"(例如神经网络辅助帧内预测、环路滤波等)嵌入到传统编解码框架,而不是立刻全面切换到端到端神经编解码。
学术侧也能看到这种"工具化落地"的轨迹。例如一篇关于 NNVC 设计与实现的综述论文就讨论了神经网络帧内预测与神经网络环路滤波等方向,并提到这些技术在 JVET 的多个会议周期中被研究并最终被采纳进 NNVC 的参考软件体系。(arXiv) 对工程团队来说,这意味着"最新视频压缩技术"的关键词里,除了 VVC/AV2 这种代际标准,还会出现越来越多"AI增强工具"------它们会先以可选模块的形态进入编码器实现,再逐步影响硬件与生态。
第7章 不只为人眼:VCM把"机器视觉任务"纳入压缩目标,重新定义什么叫"有效码率"
更激进、也更贴近未来的一条路线,是把"机器分析结果"也当作压缩对象的一部分。MPEG 在其"Video Coding for Machines(VCM)"页面给出的目标非常直白:VCM 希望标准化一种比特流格式,它由"压缩后的视频流"与"先前提取的特征(features)"共同构成,并且应该支持多种机器视觉任务。(mpeg.chiariglione.org) 这背后隐含的行业现实是:越来越多视频并不是给人看,而是给机器做检测、识别、跟踪与检索;如果最终消费方是算法,那么"把人眼主观质量维持到极致"未必是最优目标,反而可能浪费码率。
从综述角度看,VCM 的重要性不在于它明天就会替代主流流媒体编码,而在于它提示了一种新的评估坐标系:码率节省不再只用 VMAF/PSNR 这类指标衡量,还会看"机器任务精度是否下降、特征是否可复用、端侧算力是否可承受"。当"视频=数据"而不仅是"视频=内容"时,压缩技术的边界会被重新画一遍。
第8章 现实世界怎么选:编码效率、硬件覆盖、HDR与平台策略把"最新技术"拉回工程地面
讲完这些路线,真正的工程问题才浮出水面:你不可能只因为"它更新"就立刻切换,更多时候你会在多编码并存的时代做组合策略。以 AV1 为例,它的"最新价值"并不只来自效率,还来自生态与新能力的叠加:Netflix 在 AV1 推进中不仅谈节省带宽,也在面向更丰富显示技术做组合,比如有报道提到 Netflix 增加 HDR10+ 支持,并指出这项功能可在支持 AV1 的设备上使用。(Cinco Días) 另有行业报道引用 Netflix 的表述,称截至 2025 年 12 月 AV1 已承载其全球约 30% 的流媒体播放,并讨论了由此带来的带宽与体验收益以及对下一代 AV2 的展望。(TV Tech) 这些信息共同说明:平台选择编码器,往往是"压缩效率 × 端侧覆盖 × 新功能(HDR/胶片颗粒等)× 运营成本"的乘法题,而不是单一指标最优。
为了把这种取舍更直观地落到"技术综述"的语境里,下面用一张表把当前几条主线的定位放在同一画布上。表格不是结论本身,而是帮助你在讨论"最新"时避免把不同维度混为一谈。
| 路线/标准 | 核心诉求(从公开资料可核对的定位) | 你在工程决策里真正要问的问题 |
|---|---|---|
| H.266/VVC | ITU-T 推荐(2020年8月批准);强调相对 HEVC 在同主观质量下约 50% 码率降低 (ITU) | 端侧硬解覆盖与专利许可路径是否成熟?编码成本是否可控到业务规模? |
| AV1 | AOMedia 披露大规模部署数据(如 Netflix/YouTube/Meta 的 AV1 编码与播放覆盖叙事)(Alliance for Open Media) | 你的播放端是否足够覆盖AV1硬解?你的内容类型是否能吃到"效率红利"? |
| AV2 | AOMedia 公开称计划于 2025 年底完成下一代标准定稿,并披露成员采用意向调研 (Alliance for Open Media) | 现在是否要为"下一代切换"预留编码与播放策略(双轨/多轨)? |
| MPEG-5 EVC(ISO/IEC 23094-1) | ISO 标准库明确其为 EVC,定义语法、语义与解码过程 (国际标准化组织) | 你更在意"许可可控"还是"生态成熟"?是否有合作伙伴链路支持? |
| MPEG-5 LCEVC(ISO/IEC 23094-2) | ISO 标准库明确其为低复杂度增强编码;产业报道讨论其商业化许可与落地叙事 (国际标准化组织) | 你是否希望在保留基础编码生态的同时降低带宽/成本?现有链路是否容易集成增强层? |
| NNVC/ECM 与神经工具混合 | ITU/ISO相关研讨会公开提到JVET在探索NNVC、ECM及其混合方案 (ITU) | 你是否具备引入AI编码工具的算力与验证体系?如何保证跨设备一致性? |
| VCM(面向机器) | MPEG 明确目标:压缩视频流与已提取特征形成比特流,服务多种机器任务 (mpeg.chiariglione.org) | 你的"消费者"是人还是机器?指标体系该用主观质量还是任务精度? |
走到这里,你会发现"最新的视频压缩技术"其实在推动一种更成熟的工程方法论:不要执着于"单一王者编码",而要把编码器当成可组合工具,把"内容类型、播放端能力、网络条件、成本约束、合规风险、以及未来升级路径"放到同一张决策表里。短期看,AV1 的规模化与 AV2 的临近定稿,会让开放生态继续扩张;VVC 则会在高质量与高分辨率需求强的场景里持续推进;EVC 与 LCEVC 给了行业在授权与复杂度之间重新分配筹码的空间;而 NNVC/VCM 则在提醒我们,下一轮真正的"最新",可能不再以"给人看得更清楚"为唯一目标。