URP的渲染流程

Unity URP 完整渲染流程与后处理技术深度解析

引言

在游戏开发和实时渲染领域，理解渲染管线的每个阶段对于优化性能和实现复杂视觉效果至关重要。本文基于Unity URP 14.0架构，结合官方文档提供的多RTHandle Blit操作技术，深入解析从CPU到GPU再到后处理的完整渲染流程，特别重点探讨自定义后处理的实现机制以及Unity内置后处理Volume的执行位置。

第一部分：CPU阶段渲染流程详解

1.1 场景状态收集

CPU渲染流程的第一步是收集所有需要渲染的场景信息，这包括：

• 相机参数（位置、朝向、视野、投影矩阵等）

• 场景中所有可见物体的渲染组件

• 光照信息和阴影设置

• 材质属性与纹理引用

1.2 剔除(Culling)

剔除是性能优化的关键步骤，包括：

• 视锥体裁剪：移除相机视野外的物体

• 遮挡剔除：通过深度预计算或层次Z缓冲区优化

• 细节剔除：基于距离的LOD系统

• 小物体剔除：跳过小于像素阈值的物体

// 在URP中，剔除通过CullingResults管理

var cullingResults = context.Cull(ref cullingParameters);

1.3 排序(Sorting)

渲染排序确保正确的绘制顺序：

• 渲染队列排序：基于材质的RenderQueue值

• 不透明物体：从近到远排序（利用Early-Z优化）

• 透明物体：从远到近排序（确保混合正确性）

• 特殊效果排序：UI、粒子、后处理等

1.4 构建 RenderPass

在URP中，RenderPass是渲染的基本单元：

• 自定义RenderPass创建：继承ScriptableRenderPass

• Pass间依赖关系：建立多Pass渲染链

• 资源预分配：为Pass配置所需的RTHandle资源

1.5 配置 Render Target

基于多RTHandle架构配置渲染目标：

public override void SetupRenderPasses(ScriptableRenderer renderer,

in RenderingData renderingData)

{

// 创建多个RTHandle用于中间处理

var desc = renderingData.cameraData.cameraTargetDescriptor;

desc.depthBufferBits = 0;

复制代码

// 分配RTHandle资源
RenderingUtils.ReAllocateIfNeeded(ref m_IntermediateTexture, desc, 
    FilterMode.Bilinear, TextureWrapMode.Clamp, name: "_IntermediateTex");

// 配置Pass的输入输出
m_CustomPass.Setup(renderer.cameraColorTargetHandle, m_IntermediateTexture);

}

1.6 Clear(初始化)

清除操作为渲染准备干净的画布：

• 颜色缓冲区清除：设置为背景色或透明

• 深度缓冲区清除：重置为默认值（通常1.0）

• 模板缓冲区清除：清除模板掩码

• 选择性清除：根据Pass需求优化清除操作

1.7 提交 Draw / Dispatch 命令

CPU将构建好的渲染命令提交给GPU：

• Draw Call提交：绘制网格和几何体

• Compute Dispatch：调度计算着色器

• 命令缓冲区：批量提交减少CPU-GPU通信开销

• 异步操作：支持多线程渲染命令生成

第二部分：GPU阶段渲染流程详解

2.1 顶点处理

顶点着色器处理顶点级别的变换和属性计算：

// 顶点着色器典型流程

Varyings vert(Attributes input)

{

Varyings output;

复制代码

// 坐标变换流水线
float3 positionWS = TransformObjectToWorld(input.positionOS.xyz);
output.positionHCS = TransformWorldToHClip(positionWS);

// 属性传递和计算
output.normalWS = TransformObjectToWorldNormal(input.normalOS);
output.uv = TRANSFORM_TEX(input.uv, _MainTex);

return output;

}

2.2 图元装配

将顶点连接成基本图元（三角形、线段、点）：

• 顶点分组：根据拓扑结构分组顶点

• 图元构建：连接顶点形成三角形

• 背面剔除：根据顶点顺序剔除背对相机的三角形

• 视锥体裁剪：裁剪超出视野的图元

2.3 光栅化

将图元转换为像素（片元）：

• 扫描线转换：确定三角形覆盖的像素

• 插值计算：在三角形内插值顶点属性

• 深度生成：为每个片元计算深度值

• 早期深度测试：可选优化，提前丢弃不可见片元

2.4 片元着色

为每个可见像素计算最终颜色：

half4 frag(Varyings input) : SV_Target

{

// 材质属性计算

half4 albedo = SAMPLE_TEXTURE2D(_MainTex, sampler_MainTex, input.uv);

albedo.rgb *= _Color.rgb;

复制代码

// 光照计算
Light mainLight = GetMainLight();
half3 diffuse = LightingLambert(albedo.rgb, mainLight.direction, input.normalWS);

return half4(diffuse, albedo.a);

}

2.5 深度/模板/混合

固定功能测试和混合操作：

• 深度测试：基于深度缓冲区确定可见性

• 模板测试：基于模板值控制绘制区域

• 混合操作：Alpha混合、加法混合等

• 深度写入：更新深度缓冲区供后续像素使用

2.6 写入 Render Target

将处理完成的像素写入最终渲染目标：

• 多重采样解析：处理MSAA抗锯齿

• 格式转换：HDR到LDR转换

• 最终输出：写入屏幕或渲染纹理

第三部分：后处理阶段深度解析

3.1 后处理流程概览

后处理是在场景渲染完成后，对最终图像进行的全屏效果处理。基于您提供的文档，后处理可以分为三个阶段：

第一阶段：效果提取和预处理

原始场景 → 效果提取Pass → 中间纹理1

第二阶段：效果处理链

中间纹理1 → 模糊/扭曲Pass → 中间纹理2 → 色彩调整Pass → 中间纹理3

第三阶段：最终合成

中间纹理3 + 原始场景 → 合成Pass → 最终输出