图形渲染性能优化

不如学也2024-11-25 18:06

variable rate shading

conditional render

设置可见性等，不需要重新build command buffer

indirect draw

multithreading

多线程录制

实例化渲染

lod

texture array

小对象剔除

投影到屏幕上的对象太小就不绘制

texture gather

一次能采样4个像素，减少采样函数调用

texture shadow 版本

由于返回的是浮点数，能减少采样的调用

在GLSL中，使用 #pragma unroll 指令来建议编译器展开循环

c 复制代码

	循环展开不是性能优化的万能解
	需要根据具体场景和硬件特性评估
	建议进行实际性能测试
	考虑代码可维护性和可读性
	现代GPU编译器已经相当智能，可能自动进行优化

texture altas

cpp 复制代码

使用建议：

适用场景：
		大量小纹理（如UI元素、图标）
		需要批量渲染的2D游戏
		粒子系统
		不适用场景：
		大型独立纹理
		需要频繁更新的纹理
		分辨率差异很大的纹理
最佳实践：
		合理分组相关纹理
		预留适当padding
		考虑mipmap需求
		监控内存和性能指标
总结：
Texture Atlas能带来显著的性能优势，主要体现在：

减少状态切换和draw calls
提高内存访问效率
更好的缓存利用
减少内存碎片
但需要合理使用并注意相关限制和实现细节。

合并draw call

内存池和cache 命中率

纹理压缩

c 复制代码

/ 使用压缩纹理格式  
VkFormat compressedFormat = VK_FORMAT_BC7_SRGB_BLOCK;  
createTexture(compressedFormat, width, height);

图形渲染性能优化

variable rate shading

conditional render

indirect draw

multithreading

实例化渲染

lod

texture array

小对象剔除

texture gather

texture shadow 版本

在GLSL中，使用 #pragma unroll 指令来建议编译器展开循环

texture altas

合并draw call

内存池和cache 命中率

纹理压缩

多线程的视椎体剔除

simd