视频核心技术 03:H.264 / H.265 / AV1 编码标准对比 —— 压缩率、复杂度、适用场景

摘要:本文对比三大主流视频编码标准------H.264、H.265、AV1,聚焦工程师选型最关心的五个维度:压缩效率、计算复杂度、硬件生态、专利成本、适用场景。面向工程落地,不堆砌标准细节,提供清晰的选型判断依据。


1. 编码标准演进总览

视频编码的演进史,本质上是在三个互相制衡的变量之间反复做选择题:

  • 压缩效率:同等画质下码率能多低

  • 计算复杂度:编码和解码要消耗多少算力

  • 兼容性/专利成本:能不能在各种设备上播、要不要交钱

三代主流标准的定位:

维度 H.264 (AVC) H.265 (HEVC) AV1
发布年份 2003 2013 2018
相对压缩效率 基准 比 H.264 提升约 50% 比 H.265 提升约 25%-35%
编码复杂度 中等(约 H.264 的 3-5 倍) 高(软件编码约 H.264 的 10-50 倍)
解码复杂度 中等 中高(依赖硬件加速)
专利授权 专利池(Cisco 提供开源实现) 多个专利池,费用复杂 完全免版税,开源
硬件生态 几乎全部设备支持 大部分新设备支持 快速普及中
核心定位 兼容性之王 4K/HDR 主力 极致压缩 + 零专利成本

H.264 在过去近二十年里成功支撑了标清到 1080P 的视频消费浪潮,但随着 4K/8K 超高清和实时互动直播的崛起,它在压缩效率和带宽控制上的瓶颈已经愈发明显。于是 H.265 和 AV1 分别走上两条不同路线:一个是传统标准体系的延续,一个是开源免费的突围。


2. H.264:兼容性之王的技术底牌

H.264,全称 Advanced Video Coding (AVC),由 ITU-T 和 ISO/IEC 联合制定。它至今仍是流媒体领域无可争议的普及度冠军。

2.1 核心编码技术

H.264 的编码流程和我们上一章讲的"编码四步曲"完全对应:

帧内预测:同一帧内,用已编码的相邻像素块预测当前块,消除空间冗余。H.264 支持 4×4 亮度块的 9 种预测模式和 16×16 亮度块的 4 种预测模式。比如画面里有一片蓝天,编码器从上方和左侧的已编码像素直接"推测"出这一块的颜色,只记录很小的预测误差。

帧间预测:通过运动估计和运动补偿,利用已编码帧来预测当前帧。P 帧只参考前向帧,B 帧同时参考前后双向帧。这是 H.264 压缩效率的绝对主力。

变换与量化:对预测残差进行整数 DCT 变换,将像素域信息转到频率域,再通过量化步骤抛弃高频细节。

熵编码:H.264 提供 CAVLC(基于上下文的自适应变长编码)和 CABAC(基于上下文的自适应二进制算术编码)两种方案。CABAC 的压缩效率比 CAVLC 高出约 10%-15%,但计算量也更大。

2.2 工程地位:为什么现在还用它?

硬件加速无处不在。几乎所有现代设备都包含专用的 H.264 编解码电路,从十年前的旧手机到最新的智能电视,都能流畅硬解 H.264。

编码速度快。VP9 和 H.265 的软件编码处理速度比 H.264 慢约 10 到 20 倍。对于实时直播、视频会议等毫秒必争的场景,H.264 的编码速度优势意味着更低的端到端延迟。

WebRTC 强制支持。WebRTC 协议将 H.264 列为必选编码,基于浏览器的实时通话几乎绕不开它。

Cisco 开源实现。2013 年,思科将 H.264 实现以免费二进制形式开源发布,消除了中小开发者的专利焦虑,加速了 H.264 在全技术生态中的普及。

2.3 适用场景

  • 实时直播、视频会议(低延迟刚需)

  • 监控录像(兼容老旧设备)

  • 需要"保证能播"的内容分发

  • WebRTC 实时通话

3. H.265:50% 提升从哪来的?

H.265,全称 High Efficiency Video Coding (HEVC),核心目标非常明确:在相同画质下,把码率比 H.264 降低约 50%。BBC 的研究团队经过详细测试已确认这一目标确实达成了。

这 50% 的提升不是某个单一技术的魔法,而是多个模块同时升级的叠加效果。

3.1 核心升级点

升级一:编码块不再固定大小 ------ CTU 取代宏块

H.264 以固定 16×16 的宏块为基本处理单元。H.265 把这个限制打破,改用编码树单元(CTU) ,最大可达 64×64

这样做好在哪?

  • 对于 4K/8K 这种高分辨率画面,天空、墙壁等平坦区域面积巨大。用 64×64 的大块一次编码,比用 16×16 的块分 16 次编码效率高得多

  • 对于纹理复杂区域,CTU 可以递归向下分割为 32×32、16×16、8×8 等小块,灵活匹配内容复杂度

生活比喻:H.264 是只给你一个中号快递箱,不管寄一根笔还是一台冰箱都用同一套标准------大件装不下要拆,小件浪费空间。H.265 给你一整套不同尺寸的箱子,根据内容自由选择最合适的尺寸。

升级二:帧内预测方向大幅增加

H.264 的帧内预测只有 9 种方向模式。H.265 扩展到了 35 种预测方向,能更精确地"猜"出当前块的内容,预测误差更小,编码的残差数据就更少。

升级三:运动补偿精度提升

H.264 的运动矢量精度为 1/4 像素(亮度)。H.265 保持这个精度但采用了更强的亚像素插值滤波器,运动估计更准确,残差更小。

升级四:新增 SAO 滤波器

H.265 在去方块滤波器之后增加了一个样点自适应补偿(SAO) 滤波器。它能按类别修正重建图像的像素值偏移,让编码后的画面更接近原始画面,尤其对渐变色区域(天空、皮肤)有明显改善。

升级五:并行的波前处理(WPP)

为多核 CPU 做了深度优化,允许同时对帧内不同区域进行编码/解码,大幅提升吞吐量。

3.2 代价:复杂度与专利

编码复杂度约为 H.264 的 3-5 倍,解码约 2 倍。更重要的是,H.265 的专利池比 H.264 更复杂,存在多个独立的专利授权组织,费用结构不透明。这也是催生 AV1 的直接原因之一。

3.3 适用场景

  • 4K/HDR 超高清视频点播和直播

  • IPTV / 广电超高清频道

  • 手机 4K 拍摄存储(iPhone 默认使用 HEVC)

  • 对带宽成本敏感但不追求极低延迟的场景

4. AV1:开源免费的技术突围

4.1 诞生背景

H.265 发布后,专利授权问题一直是行业痛点。为打破这一僵局,2015 年 Google、Microsoft、Amazon、Netflix、Intel、Apple 等联合成立了开放媒体联盟(AOMedia),并于 2018 年正式发布 AV1 标准。

AV1 的核心卖点就三个字:免版税。 它是完全开源、完全免费的编码标准,任何人和企业无需缴纳一分钱专利费即可使用。

4.2 技术优势

AV1 的压缩效率在 H.265 的基础上再提升了约 25%-35%。即在同等画质下,码率只需 H.265 的约 65%-75%。来源进一步升级,主要靠以下技术:

  • 更大的超块(Superblock) :最大 128×128,比 H.265 的 64×64 再翻一倍,更适合 8K 内容的平坦区域

  • 非对称块分割:支持 T 形分割和楔形分割,比 H.265 的方形四叉树分割更灵活

  • 仿射运动补偿:支持 6 参数透视变换模型,对旋转、缩放等复杂运动预测更准

  • 全局运动模型(GMC) :用统一的运动模型描述整帧的全局运动(如摄像机平移),大幅减少需要编码的运动矢量

  • 环路滤波增强:除去方块滤波和约束方向增强滤波(CDEF)外,还引入了环路复原滤波(LR),主观画质更好

4.3 软件解码兜底:dav1d

在硬件解码尚未大规模普及的阶段,开源解码器 dav1d 是 AV1 生态落地的关键支柱。它由 VideoLAN 和 FFmpeg 社区联合开发,专门为 AV1 做了极致优化,性能和资源占用比参考解码器 libaom 好得多。

dav1d 覆盖了 Windows、macOS、Linux、Android、iOS 等所有主流平台,让 YouTube、Netflix 在硬解普及前就有底气推进 AV1 内容部署。

4.4 硬件加速进展(截至 2025 年)

AV1 硬解生态已从单点突破完成全品类覆盖:

芯片厂商 代表产品线
Intel 第 11 代酷睿(Tiger Lake)起全系支持
AMD Radeon RX 6000 系列及之后所有 GPU
NVIDIA RTX 30 系列起全系支持
Apple M3 起全系支持硬件解码
高通 / 联发科 2021 年起旗舰芯片陆续支持
三星 / LG / 小米 新款智能电视内置 AV1 解码器

4.5 大规模应用现状

海外的实际部署数据:

  • YouTube:超过 75% 的视频(按观看时长加权)已采用 AV1 格式

  • Meta:Facebook 和 Instagram 的 Reels 中超过 70% 的视频使用 AV1

  • Netflix:自 2020 年起在 Android 移动端部署 AV1,2022 年起向智能电视推送

4.6 软肋:编码速度

AV1 的软件编码速度比 H.264 慢 10 到 50 倍。SVT-AV1 等优化版编码器已经把这个差距缩小到约 7-10 倍,但仍然不适合需要实时编码的直播场景。

一句话:AV1 目前在点播(VOD)和离线场景已经成熟,实时直播还有待硬件编码进一步普及。

4.7 适用场景

  • OTT 视频点播(YouTube、Netflix、Bilibili 等大规模平台)

  • 高带宽成本的流媒体分发

  • 浏览器视频播放(WebRTC 有限支持)

  • 内容存档(极致压缩率 + 零专利风险)

  • 不适用:需要低延迟的实时直播(除非有 AV1 硬件编码器)

5. 三维度终极对比

5.1 压缩效率排名

假设 H.264 为基准 100%,相同画质下的大致码率需求:

text

复制代码
H.264  ████████████████████████  100%(基准)
H.265  ████████████              约 50%
AV1    ██████████                约 35%-40%

5.2 编码复杂度排名

假设 H.264 为基准 1x:

text

复制代码
H.264  ██                        1x
H.265  ██████                    3-5x
AV1    ████████████████          10-50x(软件编码)

5.3 综合对比表

维度 H.264 H.265 AV1
压缩效率 基准 +50% +25%-35%(对比 H.265)
软件编码速度 极快 慢(约 1/10) 极慢(约 1/10-1/50)
硬件编码成熟度 完全成熟 成熟 部分成熟
硬件解码覆盖 几乎 100% 约 90% 约 60-70%(快速成长)
浏览器支持 全部 部分 Chrome / Firefox / Edge 支持
WebRTC 强制支持 有限 最小支持
专利费用 低(有 Cisco 免费版) 高(多专利池,复杂) 零(完全开源免费)
移动端支持 几乎全部设备 大多数新设备 有限但增长中
延迟 极低 中高(软件编码)

6. 选型决策指南

选编码格式不是选"谁最强",而是选"谁最匹配当前场景的约束条件"。按场景分类:

场景一:实时直播 / 视频会议

首选 H.264。原因:编码速度极快,延迟最低,所有设备都支持硬件编解码,WebRTC 强制要求。H.265 在有硬件编码的设备上也可考虑,能省一半上行带宽。

场景二:UHD(4K/8K)直播

首选 H.265。原因:同等码率下画质远超 H.264,硬件编码方案成熟,延迟可控制在 200ms 以内,移动端硬解覆盖率高。

场景三:OTT 点播平台(大规模分发)

首选 AV1 或 H.265 + AV1 双轨策略。原因:AV1 的 25%-35% 额外码率节省对大规模分发的带宽成本影响巨大。YouTube、Netflix、Meta 已大规模部署 AV1 点播内容。对带宽成本极其敏感的流媒体平台,AV1 是当前最优解。

场景四:视频监控 / 安防

首选 H.264 或 H.265。原因:大量存量摄像头只支持 H.264,成本敏感;H.265 在新部署的 4K 监控场景中价值明显。AV1 的编码复杂度在此类资源受限设备上不现实。

场景五:移动端拍摄存储

首选 H.265。原因:iPhone 和多数 Android 旗舰机默认使用 HEVC 存储,同等画质文件体积减半,拍照录视频最直接的存储节省。

场景六:内容归档

首选 AV1 或 H.265。原因:离线转码没有实时性要求,AV1 能在保证画质的前提下达到最低存储成本,且无专利风险。如果编码算力有限,H.265 是合理折中。

场景七:最高兼容性需求(如给不特定用户发视频)

首选 H.264。原因:你无法控制对方用什么设备解码,H.264 是目前唯一可以"闭着眼睛选也能播"的编码格式。

决策速查表

你需要什么? 推荐编码 理由
最低延迟 H.264 编码速度极快,硬解覆盖 100%
省带宽 / 省存储 AV1(离线)或 H.265(实时) 压缩效率最高
零专利风险 AV1 免版税、开源
最大兼容性 H.264 所有设备都能播
4K/HDR 画质优先 H.265 成熟硬解 + 50% 压缩提升
大规模流媒体分发 AV1 带宽成本直接砍 30%+
移动端拍视频省空间 H.265 旗舰机默认格式

7. 小结

标准 一句话定位
H.264 兼容性之王,能播最重要
H.265 4K 时代主力,画质与带宽的最佳平衡点
AV1 开源免费的未来,极致压缩但编码尚慢

三者的关系不是互相替代,而是分层协同。实际工程中,常见架构是用 H.264 覆盖实时场景和低端设备兼容,用 H.265 覆盖 4K/HDR 内容,用 AV1 覆盖 OTT 点播和大规模分发。转码流水线通常将源文件同时输出多份不同编码格式的副本,由播放器根据网络和硬件能力自适应选择最佳编码。

选型本质上是 压缩效率、计算复杂度、专利成本、兼容性 这四个变量的权衡。H.264 胜在兼容,H.265 胜在平衡,AV1 胜在压缩和免费。三个标准各占生态位,短期内不会有谁能完全替代谁。

相关推荐
黄昏恋慕黎明1 小时前
音视频测试
音视频
果果开发ggdoc.cn2 小时前
我找到一个在线视频处理工具,不用上传,本地就能转格式、提取音频和字幕
音视频
网管NO.12 小时前
视频核心技术 05:流媒体传输协议 —— RTMP、HLS、WebRTC 怎么选?延迟、卡顿、原理全解
音视频
呉師傅2 小时前
将CD音频抓轨转换成MP3的两种方法【图文解释】
运维·服务器·网络·windows·电脑·音视频
愚公搬代码2 小时前
【愚公系列】《AI漫剧创作一本通》024-Al 漫剧视频生成(AI漫剧视频生成工具)
人工智能·音视频
沉浸式学习ing17 小时前
B站视频怎么快速总结?AI自动生成要点+思维导图+逐字稿
人工智能·ai·自然语言处理·音视频·语音识别·notion
KKei163817 小时前
Flutter for OpenHarmony 学习视频播放器技术文章
学习·flutter·华为·音视频·harmonyos
神秘剑客_CN19 小时前
视频添加水印批处理-漫剧版
音视频
一路向北he19 小时前
音频1db是什么?
音视频