图形渲染性能优化

variable rate shading

conditional render

设置可见性等, 不需要重新build command buffer

indirect draw

multithreading

多线程录制

实例化渲染

lod

texture array

小对象剔除

投影到屏幕上的对象太小就不绘制

texture gather

一次能采样4个像素, 减少采样函数调用

texture shadow 版本

由于返回的是浮点数,能减少采样的调用

在GLSL中,使用 #pragma unroll 指令来建议编译器展开循环

c 复制代码
	循环展开不是性能优化的万能解
	需要根据具体场景和硬件特性评估
	建议进行实际性能测试
	考虑代码可维护性和可读性
	现代GPU编译器已经相当智能,可能自动进行优化

texture altas

cpp 复制代码
使用建议:

适用场景:
		大量小纹理(如UI元素、图标)
		需要批量渲染的2D游戏
		粒子系统
		不适用场景:
		大型独立纹理
		需要频繁更新的纹理
		分辨率差异很大的纹理
最佳实践:
		合理分组相关纹理
		预留适当padding
		考虑mipmap需求
		监控内存和性能指标
总结:
Texture Atlas能带来显著的性能优势,主要体现在:

减少状态切换和draw calls
提高内存访问效率
更好的缓存利用
减少内存碎片
但需要合理使用并注意相关限制和实现细节。

合并draw call

内存池和cache 命中率

纹理压缩

c 复制代码
/ 使用压缩纹理格式  
VkFormat compressedFormat = VK_FORMAT_BC7_SRGB_BLOCK;  
createTexture(compressedFormat, width, height);  

多线程的视椎体剔除

simd

相关推荐
穷人小水滴2 个月前
Windows (rust) vulkan 画一个三角形: 窗口创建与渲染初始化
开发语言·windows·rust·gpu·窗口·vulkan
穷人小水滴2 个月前
Android (rust) vulkan (JNI) 画一个三角形: VulkanSurfaceView 初始化
android·开发语言·rust·gpu·jni·vulkan·surfaceview
穷人小水滴3 个月前
(章节 3.1) 本地运行 AI 有多慢 ? 大模型推理测速 (llama.cpp, Intel GPU A770)
人工智能·llama·llama.cpp·a770·vulkan·gnu/linux·sycl
穷人小水滴3 个月前
编译运行 llama.cpp (vulkan, Intel GPU SYCL)
ai·gpu·intel·llama.cpp·a770·vulkan·sycl
Justgoodnight8 个月前
M芯片 mac配置Vulkan环境报错 Xcode
macos·xcode·vulkan