哪些因素和参数会影响Bloom的性能开销

1)哪些因素和参数会影响Bloom的性能开销
2)为何Scripting Threads的#0线程数量异常


这是第457篇UWA技术知识分享的推送,精选了UWA社区的热门话题,涵盖了UWA问答、社区帖子等技术知识点,助力大家更全面地掌握和学习。

From UWA AI 问答

Q:哪些因素和参数会影响bloom的性能开销?

A:Bloom(泛光)的性能开销主要来自GPU带宽、计算量与多级采样次数,其关键影响因素和可调参数如下:

一、核心性能影响因素

  1. 采样分辨率与下采样层级
  • Bloom默认从1/2渲染分辨率开始逐级下采样(如Blur1--Blur5),分辨率越低(如1/16)、层级越多,带宽越低但模糊质量下降;反之,高分辨率采样(如1/2)显著增加纹理读取带宽和显存吞吐压力。
  • 移动端建议从1/4或1/8起始,减少首层采样开销。
  1. BloomQuality级别

    r.BloomQuality=5(默认)启用全部5层模糊+高质量卷积,开销最大;=1~3可禁用部分层级或使用简化高斯,大幅降低GPU耗时。

  2. ScreenPercentage控制卷积精度

    r.Bloom.ScreenPercentage=50表示FFT卷积在50%分辨率下执行;提高该值(如至100%)会线性增加计算与带宽,需谨慎权衡。

  3. 泛光卷积(Convolution)启用

    启用Bloom Convolution会触发FFT卷积运算,依赖全分辨率内核纹理+额外缓冲区(r.Bloom.ConvolutionBuffer),显著提升GPU计算与显存带宽压力,仅推荐高端设备或离线渲染使用

  4. 后处理链路叠加效应

    Bloom常与Tonemapping、Depth of Field、Motion Blur等串联,导致多次全屏纹理读写。尤其在移动平台,多Pass后处理易引发带宽瓶颈(实测可达总GPU带宽的20%+)。

二、关键可调控制台变量(Unreal Engine)

三、优化建议

  • 优先降级BloomQuality+ScreenPercentage,比关闭Bloom更能平衡画质与性能;
  • 使用Stat GPU和Stat RHI定量定位Bloom耗时(查看PostProcessBloom阶段);
  • 避免在低端机启用Convolution或Dirt Mask(额外纹理采样+混合);
  • 结合r.VSync与帧率限制,防止Bloom在高帧率下反复重采样。

注:Bloom对GPU温度与功耗影响显著 ------ 实测10GB/s带宽可贡献约1000mW功耗(占整机20%+),是移动端发热主因之一。

分享链接:
https://www.uwa4d.com/main/uwa-shared.html?shareId=f3f99f69-7e55-4af8-9a58-2531d33ec39a


From UWA AI 问答

Q:请教个问题, 我们有用到线程池, 我在Profiler的时候看到在Scripting Threads里面有几十个#0的线程显示, 这个是正常的吗?

A:是不正常的,需立即排查。

Unity的Profiler中出现大量名称为#0的Scripting Threads,通常表明:
线程未正确命名或未注册 :Unity默认对System.Threading.ThreadPool中的线程不自动命名,Profiler无法识别其用途,统一显示为#0(或空名+编号)。

线程泄漏风险高 :若线程池长期持有大量闲置线程(尤其在Unity 2019 -- 2022版本中),可能因ThreadPool.SetMinThreads调用不当、异步任务未完成/未释放、或Task.Run+长阻塞操作导致线程堆积。

非Unity管理线程被误纳入Profiler视图 :#0线程无法通过Profiler.BeginThreadProfiling()注册,说明它们未被主动追踪,也意味着你无法在Timeline中定位其耗时来源。

建议动作:

  • 检查是否滥用Task.Run或ThreadPool.QueueUserWorkItem;优先改用Unity Job System或Unity.Collections.LowLevel.Unsafe异步方案。
  • 确认无new Thread(...).Start()后未调用Profiler.EndThreadProfiling()(否则资源泄漏且线程残留)。
  • 在Editor中启用Call Stacks+Deep Profiling,筛选GC Alloc/CPU高耗时帧,定位创建线程的调用栈。
  • 使用UWA GOT Online的Mono/Threading模块,查看线程数趋势与存活时间,确认是否随游戏时长持续增长。

注:Unity官方不鼓励直接使用.NET线程池进行高频短任务调度 ------ Job System才是跨平台、可Profiler可视化的首选。

分享链接:
https://www.uwa4d.com/main/uwa-shared.html?shareId=3ba6d84d-9e4e-4fb2-a66f-f6fdc562b15f

无论是社区里开发者们的互助讨论,还是AI基于知识沉淀的快速反馈,核心都是为了让每一个技术难题都有解、每一次踩坑都有回响。本期分享分别来自UWA AI问答和UWA问答社区,希望这些从真实开发场景中提炼的经验,能直接帮你解决当下的技术卡点,也让你在遇到同类问题时,能更高效地找到破局方向。

封面图来源于网络


今天的分享就到这里。生有涯而知无涯,在漫漫的开发周期中,我们遇到的问题只是冰山一角,UWA社区愿伴你同行,一起探索分享。欢迎更多的开发者加入UWA社区。

UWA官网:www.uwa4d.com
UWA社区:community.uwa4d.com
UWA学堂:edu.uwa4d.com

相关推荐
逍遥德1 天前
如何提高代码可读性
java·开发语言·性能优化·intellij idea·代码规范
小北方城市网1 天前
MyBatis-Plus 生产级深度优化:从性能到安全的全维度方案
开发语言·redis·分布式·python·缓存·性能优化·mybatis
没有bug.的程序员1 天前
Spring Boot 性能优化:启动时间从 5s 到 1s 的全链路实战指南
java·spring boot·后端·spring·性能优化·全链路·启动时间
landonVM1 天前
OpenResty 的性能优化配置建议
性能优化·openresty
冬奇Lab1 天前
【Kotlin系列16】性能优化:内联、内存与字节码分析
开发语言·性能优化·kotlin
砚边数影2 天前
InfluxDB迁移替换实战:金仓时序数据库如何提高写入性能
数据库·性能优化·时序数据库·kingbase·kingbasees·金仓数据库
卓码软件测评2 天前
第三方CNAS/CMA软件测试测评机构【LoadRunner的JSON和XML响应数据的关联和处理技巧】
测试工具·ci/cd·性能优化·单元测试·测试用例
Thomas_YXQ2 天前
Unity3D中提升AssetBundle加载速度的详细指南
java·spring boot·spring·unity·性能优化·游戏引擎·游戏开发
上海云盾-小余2 天前
WAF性能优化:如何平衡安全防护与网站访问速度?
网络·安全·性能优化
EndingCoder2 天前
性能优化:类型系统的最佳实践
linux·前端·javascript·ubuntu·性能优化·typescript