关于H.264,H.265,H.266相关资料链接:
视频编码中的主要技术
视频编码的目标是在保证视频质量的前提下,尽可能减少数据量。以下是视频编码中的核心技术:
- 块划分(Block Partitioning)
- 将视频帧划分为小块,以便后续进行预测、变换和量化。
- 块的大小和形状直接影响编码效率。
- 帧内预测(Intra Prediction)
- 利用同一帧内相邻像素的相关性,预测当前块的像素值。
- 目的是减少空间冗余。
- 帧间预测(Inter Prediction)
- 利用时间上相邻帧的内容,通过运动估计和运动补偿预测当前块的像素值。
- 目的是减少时间冗余。
- 变换(Transform)
- 将预测残差(预测值与实际值的差值)从空间域转换到频率域,集中能量,便于压缩。
- 量化(Quantization)
- 对变换后的系数进行舍入处理,减少数据量。
- 量化步长决定了压缩率和视频质量的平衡。
- 熵编码(Entropy Coding)
- 对量化后的数据进行无损压缩,利用数据的统计特性进一步减少比特率。
- 环路滤波(In-loop Filtering)
- 在编码和解码过程中对重建图像进行滤波,减少压缩带来的伪影,提升质量。
H.264 (AVC)
H.264 是一个重要的视频编码标准,奠定了现代视频压缩的基础。
主要技术特点
- 块划分:使用 16x16 像素的宏块(macroblock),可细分为 8x8 或 4x4 的子块。
- 帧内预测:支持 9 种 4x4 块预测模式和 4 种 16x16 块预测模式。
- 帧间预测:支持 1/4 像素精度的运动向量。
- 变换:采用 4x4 和 8x8 的整数 DCT 变换。
- 熵编码:提供 CAVLC(基于变长编码)和 CABAC(基于上下文自适应的二进制算术编码)两种选择。
- 环路滤波:引入去块滤波器(deblocking filter),减少块效应伪影。
H.265 (HEVC) 相较于 H.264 的改进
H.265 在 H.264 的基础上大幅提升了压缩效率,尤其适用于高分辨率视频。
具体改进
- 块划分
- 改进:从固定的 16x16 宏块升级为编码树单元(CTU),最大支持 64x64,并采用四叉树结构,动态划分至 8x8。
- 优势:更灵活的块划分,能根据内容复杂度优化压缩效率。
- 帧内预测
- 改进:预测模式从 9/4 种增加到 35 种,支持更多预测方向。
- 优势:更精确的预测,减少空间残差。
- 帧间预测
- 改进:引入高级运动向量预测(AMVP)和合并模式(merge mode),优化运动信息编码。
- 优势:减少描述运动所需的比特,提升时间预测效率。
- 变换
- 改进:支持更大的变换尺寸,最高达 32x32。
- 优势:更好地捕捉大块区域的低频信息,减少残差数据量。
- 环路滤波
- 改进:在去块滤波器的基础上新增样本自适应偏移(SAO)滤波器。
- 优势:进一步减少伪影,提升视觉质量和预测精度。
- 熵编码
- 改进:CABAC 性能得到优化。
- 优势:提高无损压缩效率。
总体效果:在相同质量下,H.265 的比特率约为 H.264 的一半。
H.266 (VVC) 相较于 H.265 的改进
H.266 是最新的视频编码标准,进一步提升压缩效率并支持更多应用场景。
具体改进
- 块划分
- 改进:采用四叉树加二叉树(QTBT)结构,支持矩形块划分,最大尺寸仍为 64x64。
- 优势:更灵活的划分方式,能更好地适应复杂内容。
- 帧内预测
- 改进:预测模式从 35 种增加到 67 种,方向更精细。
- 优势:提升预测精度,进一步减少空间冗余。
- 帧间预测
- 改进:引入仿射运动补偿(affine motion compensation),支持旋转、缩放等复杂运动。
- 优势:更准确地模拟真实物体运动,提升时间预测效果。
- 变换
- 改进:支持多种变换选择(MTS,如 DCT 和 DST),变换尺寸扩展至 64x64。
- 优势:根据内容选择最优变换,减少残差数据量。
- 环路滤波
- 改进:新增自适应环路滤波器(ALF),与去块滤波器和 SAO 协同工作。
- 优势:自适应调整滤波策略,显著减少伪影。
- 熵编码
- 改进:进一步优化 CABAC 的上下文建模。
- 优势:提升无损压缩效率。
总体效果:在相同质量下,H.266 的比特率比 H.265 再降低 30-50%。
压缩效率与带宽需求
- H.264(1080p@30fps) :
- 典型码率:4-8 Mbps
- 适用场景:普通网络直播、标清视频存储。
- H.265(4K@30fps) :
- 典型码率:10-20 Mbps(比H.264节省50%带宽)
- 适用场景:4K流媒体(如Netflix)、超高清监控。
- H.266(8K@60fps) :
- 典型码率:20-40 Mbps(比H.265节省50%带宽)
- 适用场景:8K广播电视、VR游戏串流。
示例:一部90分钟的4K电影:
- H.264:约50 GB
- H.265:约25 GB
- H.266:约12.5 GB
2. 计算复杂度与硬件需求
标准 | 编码复杂度(相对值) | 典型硬件支持 |
---|---|---|
H.264 | 1x | 手机SoC(2010年后)、低端摄像头 |
H.265 | 3-5x | 高端手机(如iPhone 12+)、4K电视芯片 |
H.266 | 8-10x | 最新GPU(NVIDIA RTX 40系列)、专用编码芯片 |
市场应用与竞争格局
1. H.264/H.265/H.266的当前应用
- H.264:仍占主流(约60%视频流量),尤其在监控摄像头、视频会议(Zoom默认编码)。
- H.265:4K流媒体(YouTube、Disney+)、苹果生态(iPhone录制的4K视频)。
- H.266:试验阶段,如日本8K电视台、Meta的VR直播。
2. 与AV1的竞争
- H.266优势 :
- 压缩效率略高于AV1(约5-10%)。
- 硬件加速生态更成熟(华为海思、联发科芯片已支持)。
- AV1优势 :
- 免专利费(由AOM联盟推动,谷歌/Netflix支持)。
- 已广泛应用于YouTube、TikTok等平台。
预测:未来5年,H.266将在超高清专业领域(广电、医疗影像)领先,而AV1主导消费级流媒体。