摘要:本文对比三大主流视频编码标准------H.264、H.265、AV1,聚焦工程师选型最关心的五个维度:压缩效率、计算复杂度、硬件生态、专利成本、适用场景。面向工程落地,不堆砌标准细节,提供清晰的选型判断依据。
1. 编码标准演进总览
视频编码的演进史,本质上是在三个互相制衡的变量之间反复做选择题:
-
压缩效率:同等画质下码率能多低
-
计算复杂度:编码和解码要消耗多少算力
-
兼容性/专利成本:能不能在各种设备上播、要不要交钱
三代主流标准的定位:
| 维度 | H.264 (AVC) | H.265 (HEVC) | AV1 |
|---|---|---|---|
| 发布年份 | 2003 | 2013 | 2018 |
| 相对压缩效率 | 基准 | 比 H.264 提升约 50% | 比 H.265 提升约 25%-35% |
| 编码复杂度 | 低 | 中等(约 H.264 的 3-5 倍) | 高(软件编码约 H.264 的 10-50 倍) |
| 解码复杂度 | 低 | 中等 | 中高(依赖硬件加速) |
| 专利授权 | 专利池(Cisco 提供开源实现) | 多个专利池,费用复杂 | 完全免版税,开源 |
| 硬件生态 | 几乎全部设备支持 | 大部分新设备支持 | 快速普及中 |
| 核心定位 | 兼容性之王 | 4K/HDR 主力 | 极致压缩 + 零专利成本 |
H.264 在过去近二十年里成功支撑了标清到 1080P 的视频消费浪潮,但随着 4K/8K 超高清和实时互动直播的崛起,它在压缩效率和带宽控制上的瓶颈已经愈发明显。于是 H.265 和 AV1 分别走上两条不同路线:一个是传统标准体系的延续,一个是开源免费的突围。
2. H.264:兼容性之王的技术底牌
H.264,全称 Advanced Video Coding (AVC),由 ITU-T 和 ISO/IEC 联合制定。它至今仍是流媒体领域无可争议的普及度冠军。
2.1 核心编码技术
H.264 的编码流程和我们上一章讲的"编码四步曲"完全对应:
帧内预测:同一帧内,用已编码的相邻像素块预测当前块,消除空间冗余。H.264 支持 4×4 亮度块的 9 种预测模式和 16×16 亮度块的 4 种预测模式。比如画面里有一片蓝天,编码器从上方和左侧的已编码像素直接"推测"出这一块的颜色,只记录很小的预测误差。
帧间预测:通过运动估计和运动补偿,利用已编码帧来预测当前帧。P 帧只参考前向帧,B 帧同时参考前后双向帧。这是 H.264 压缩效率的绝对主力。
变换与量化:对预测残差进行整数 DCT 变换,将像素域信息转到频率域,再通过量化步骤抛弃高频细节。
熵编码:H.264 提供 CAVLC(基于上下文的自适应变长编码)和 CABAC(基于上下文的自适应二进制算术编码)两种方案。CABAC 的压缩效率比 CAVLC 高出约 10%-15%,但计算量也更大。
2.2 工程地位:为什么现在还用它?
硬件加速无处不在。几乎所有现代设备都包含专用的 H.264 编解码电路,从十年前的旧手机到最新的智能电视,都能流畅硬解 H.264。
编码速度快。VP9 和 H.265 的软件编码处理速度比 H.264 慢约 10 到 20 倍。对于实时直播、视频会议等毫秒必争的场景,H.264 的编码速度优势意味着更低的端到端延迟。
WebRTC 强制支持。WebRTC 协议将 H.264 列为必选编码,基于浏览器的实时通话几乎绕不开它。
Cisco 开源实现。2013 年,思科将 H.264 实现以免费二进制形式开源发布,消除了中小开发者的专利焦虑,加速了 H.264 在全技术生态中的普及。
2.3 适用场景
-
实时直播、视频会议(低延迟刚需)
-
监控录像(兼容老旧设备)
-
需要"保证能播"的内容分发
-
WebRTC 实时通话
3. H.265:50% 提升从哪来的?
H.265,全称 High Efficiency Video Coding (HEVC),核心目标非常明确:在相同画质下,把码率比 H.264 降低约 50%。BBC 的研究团队经过详细测试已确认这一目标确实达成了。
这 50% 的提升不是某个单一技术的魔法,而是多个模块同时升级的叠加效果。
3.1 核心升级点
升级一:编码块不再固定大小 ------ CTU 取代宏块
H.264 以固定 16×16 的宏块为基本处理单元。H.265 把这个限制打破,改用编码树单元(CTU) ,最大可达 64×64。
这样做好在哪?
-
对于 4K/8K 这种高分辨率画面,天空、墙壁等平坦区域面积巨大。用 64×64 的大块一次编码,比用 16×16 的块分 16 次编码效率高得多
-
对于纹理复杂区域,CTU 可以递归向下分割为 32×32、16×16、8×8 等小块,灵活匹配内容复杂度
生活比喻:H.264 是只给你一个中号快递箱,不管寄一根笔还是一台冰箱都用同一套标准------大件装不下要拆,小件浪费空间。H.265 给你一整套不同尺寸的箱子,根据内容自由选择最合适的尺寸。
升级二:帧内预测方向大幅增加
H.264 的帧内预测只有 9 种方向模式。H.265 扩展到了 35 种预测方向,能更精确地"猜"出当前块的内容,预测误差更小,编码的残差数据就更少。
升级三:运动补偿精度提升
H.264 的运动矢量精度为 1/4 像素(亮度)。H.265 保持这个精度但采用了更强的亚像素插值滤波器,运动估计更准确,残差更小。
升级四:新增 SAO 滤波器
H.265 在去方块滤波器之后增加了一个样点自适应补偿(SAO) 滤波器。它能按类别修正重建图像的像素值偏移,让编码后的画面更接近原始画面,尤其对渐变色区域(天空、皮肤)有明显改善。
升级五:并行的波前处理(WPP)
为多核 CPU 做了深度优化,允许同时对帧内不同区域进行编码/解码,大幅提升吞吐量。
3.2 代价:复杂度与专利
编码复杂度约为 H.264 的 3-5 倍,解码约 2 倍。更重要的是,H.265 的专利池比 H.264 更复杂,存在多个独立的专利授权组织,费用结构不透明。这也是催生 AV1 的直接原因之一。
3.3 适用场景
-
4K/HDR 超高清视频点播和直播
-
IPTV / 广电超高清频道
-
手机 4K 拍摄存储(iPhone 默认使用 HEVC)
-
对带宽成本敏感但不追求极低延迟的场景
4. AV1:开源免费的技术突围
4.1 诞生背景
H.265 发布后,专利授权问题一直是行业痛点。为打破这一僵局,2015 年 Google、Microsoft、Amazon、Netflix、Intel、Apple 等联合成立了开放媒体联盟(AOMedia),并于 2018 年正式发布 AV1 标准。
AV1 的核心卖点就三个字:免版税。 它是完全开源、完全免费的编码标准,任何人和企业无需缴纳一分钱专利费即可使用。
4.2 技术优势
AV1 的压缩效率在 H.265 的基础上再提升了约 25%-35%。即在同等画质下,码率只需 H.265 的约 65%-75%。来源进一步升级,主要靠以下技术:
-
更大的超块(Superblock) :最大 128×128,比 H.265 的 64×64 再翻一倍,更适合 8K 内容的平坦区域
-
非对称块分割:支持 T 形分割和楔形分割,比 H.265 的方形四叉树分割更灵活
-
仿射运动补偿:支持 6 参数透视变换模型,对旋转、缩放等复杂运动预测更准
-
全局运动模型(GMC) :用统一的运动模型描述整帧的全局运动(如摄像机平移),大幅减少需要编码的运动矢量
-
环路滤波增强:除去方块滤波和约束方向增强滤波(CDEF)外,还引入了环路复原滤波(LR),主观画质更好
4.3 软件解码兜底:dav1d
在硬件解码尚未大规模普及的阶段,开源解码器 dav1d 是 AV1 生态落地的关键支柱。它由 VideoLAN 和 FFmpeg 社区联合开发,专门为 AV1 做了极致优化,性能和资源占用比参考解码器 libaom 好得多。
dav1d 覆盖了 Windows、macOS、Linux、Android、iOS 等所有主流平台,让 YouTube、Netflix 在硬解普及前就有底气推进 AV1 内容部署。
4.4 硬件加速进展(截至 2025 年)
AV1 硬解生态已从单点突破完成全品类覆盖:
| 芯片厂商 | 代表产品线 |
|---|---|
| Intel | 第 11 代酷睿(Tiger Lake)起全系支持 |
| AMD | Radeon RX 6000 系列及之后所有 GPU |
| NVIDIA | RTX 30 系列起全系支持 |
| Apple | M3 起全系支持硬件解码 |
| 高通 / 联发科 | 2021 年起旗舰芯片陆续支持 |
| 三星 / LG / 小米 | 新款智能电视内置 AV1 解码器 |
4.5 大规模应用现状
海外的实际部署数据:
-
YouTube:超过 75% 的视频(按观看时长加权)已采用 AV1 格式
-
Meta:Facebook 和 Instagram 的 Reels 中超过 70% 的视频使用 AV1
-
Netflix:自 2020 年起在 Android 移动端部署 AV1,2022 年起向智能电视推送
4.6 软肋:编码速度
AV1 的软件编码速度比 H.264 慢 10 到 50 倍。SVT-AV1 等优化版编码器已经把这个差距缩小到约 7-10 倍,但仍然不适合需要实时编码的直播场景。
一句话:AV1 目前在点播(VOD)和离线场景已经成熟,实时直播还有待硬件编码进一步普及。
4.7 适用场景
-
OTT 视频点播(YouTube、Netflix、Bilibili 等大规模平台)
-
高带宽成本的流媒体分发
-
浏览器视频播放(WebRTC 有限支持)
-
内容存档(极致压缩率 + 零专利风险)
-
不适用:需要低延迟的实时直播(除非有 AV1 硬件编码器)
5. 三维度终极对比
5.1 压缩效率排名
假设 H.264 为基准 100%,相同画质下的大致码率需求:
text
H.264 ████████████████████████ 100%(基准)
H.265 ████████████ 约 50%
AV1 ██████████ 约 35%-40%
5.2 编码复杂度排名
假设 H.264 为基准 1x:
text
H.264 ██ 1x
H.265 ██████ 3-5x
AV1 ████████████████ 10-50x(软件编码)
5.3 综合对比表
| 维度 | H.264 | H.265 | AV1 |
|---|---|---|---|
| 压缩效率 | 基准 | +50% | +25%-35%(对比 H.265) |
| 软件编码速度 | 极快 | 慢(约 1/10) | 极慢(约 1/10-1/50) |
| 硬件编码成熟度 | 完全成熟 | 成熟 | 部分成熟 |
| 硬件解码覆盖 | 几乎 100% | 约 90% | 约 60-70%(快速成长) |
| 浏览器支持 | 全部 | 部分 | Chrome / Firefox / Edge 支持 |
| WebRTC | 强制支持 | 有限 | 最小支持 |
| 专利费用 | 低(有 Cisco 免费版) | 高(多专利池,复杂) | 零(完全开源免费) |
| 移动端支持 | 几乎全部设备 | 大多数新设备 | 有限但增长中 |
| 延迟 | 极低 | 低 | 中高(软件编码) |
6. 选型决策指南
选编码格式不是选"谁最强",而是选"谁最匹配当前场景的约束条件"。按场景分类:
场景一:实时直播 / 视频会议
首选 H.264。原因:编码速度极快,延迟最低,所有设备都支持硬件编解码,WebRTC 强制要求。H.265 在有硬件编码的设备上也可考虑,能省一半上行带宽。
场景二:UHD(4K/8K)直播
首选 H.265。原因:同等码率下画质远超 H.264,硬件编码方案成熟,延迟可控制在 200ms 以内,移动端硬解覆盖率高。
场景三:OTT 点播平台(大规模分发)
首选 AV1 或 H.265 + AV1 双轨策略。原因:AV1 的 25%-35% 额外码率节省对大规模分发的带宽成本影响巨大。YouTube、Netflix、Meta 已大规模部署 AV1 点播内容。对带宽成本极其敏感的流媒体平台,AV1 是当前最优解。
场景四:视频监控 / 安防
首选 H.264 或 H.265。原因:大量存量摄像头只支持 H.264,成本敏感;H.265 在新部署的 4K 监控场景中价值明显。AV1 的编码复杂度在此类资源受限设备上不现实。
场景五:移动端拍摄存储
首选 H.265。原因:iPhone 和多数 Android 旗舰机默认使用 HEVC 存储,同等画质文件体积减半,拍照录视频最直接的存储节省。
场景六:内容归档
首选 AV1 或 H.265。原因:离线转码没有实时性要求,AV1 能在保证画质的前提下达到最低存储成本,且无专利风险。如果编码算力有限,H.265 是合理折中。
场景七:最高兼容性需求(如给不特定用户发视频)
首选 H.264。原因:你无法控制对方用什么设备解码,H.264 是目前唯一可以"闭着眼睛选也能播"的编码格式。
决策速查表
| 你需要什么? | 推荐编码 | 理由 |
|---|---|---|
| 最低延迟 | H.264 | 编码速度极快,硬解覆盖 100% |
| 省带宽 / 省存储 | AV1(离线)或 H.265(实时) | 压缩效率最高 |
| 零专利风险 | AV1 | 免版税、开源 |
| 最大兼容性 | H.264 | 所有设备都能播 |
| 4K/HDR 画质优先 | H.265 | 成熟硬解 + 50% 压缩提升 |
| 大规模流媒体分发 | AV1 | 带宽成本直接砍 30%+ |
| 移动端拍视频省空间 | H.265 | 旗舰机默认格式 |
7. 小结
| 标准 | 一句话定位 |
|---|---|
| H.264 | 兼容性之王,能播最重要 |
| H.265 | 4K 时代主力,画质与带宽的最佳平衡点 |
| AV1 | 开源免费的未来,极致压缩但编码尚慢 |
三者的关系不是互相替代,而是分层协同。实际工程中,常见架构是用 H.264 覆盖实时场景和低端设备兼容,用 H.265 覆盖 4K/HDR 内容,用 AV1 覆盖 OTT 点播和大规模分发。转码流水线通常将源文件同时输出多份不同编码格式的副本,由播放器根据网络和硬件能力自适应选择最佳编码。
选型本质上是 压缩效率、计算复杂度、专利成本、兼容性 这四个变量的权衡。H.264 胜在兼容,H.265 胜在平衡,AV1 胜在压缩和免费。三个标准各占生态位,短期内不会有谁能完全替代谁。