解决TensorRT加速推理SDXL出现黑图问题

文章目录

解决TensorRT加速推理SDXL出现黑图问题

一般产生黑图,仅需要修改下面两个问题即可解决。

1. fp16

将pipeline中的fp16修改为fp32。

在使用稳定扩散(Stable Diffusion)生成图片时,选择不同的数据类型可以影响生成的结果。在这种情况下,从fp16(半精度浮点数)切换到fp32(单精度浮点数)解决了问题,通常意味着精度的不同可能导致了生成的结果差异。

  • fp16(半精度):它使用更短的位数来表示浮点数,因此可以表示的数值范围相对较小,精度较低。这可以导致数值不稳定性和溢出问题,尤其是在涉及大范围数值计算时。

  • fp32(单精度):它使用更多的位数,可以表示更广范围的数值并提供更高的精度。在计算中,fp32通常更可靠,尤其是在大规模深度学习模型中,因为它可以减少数值稳定性问题。

生成黑图的问题可能与fp16的数值范围和精度不足有关,导致计算过程中的数值溢出或不稳定性。当使用fp32时,数值稳定性更高,能够处理较大的数值范围。

2. 更换vae

在TensorRT进行编译的时候,会首先找到torch models,将torch models的vae_decoder的配置文件和权重修改为https://huggingface.co/madebyollin/sdxl-vae-fp16-fix时,完美解决问题。

相关推荐
laugh123211 个月前
TensorRT-YOLO:灵活易用的 YOLO 部署工具
tensorrt·模型部署·c/c++·模型加密
Arnold-FY-Chen1 个月前
多核并发编译引起的编译错误
make·tensorrt·plugin
爱听歌的周童鞋1 个月前
Depth-Anything推理详解及部署实现(下)
tensorrt·cuda·deploy·mde·depth anything
因为风的缘故~1 个月前
Ubuntu22.04安装cuda12.1+cudnn8.9.2+TensorRT8.6.1+pytorch2.3.0+opencv_cuda4.9+onnxruntime-gpu1.18
pytorch·深度学习·tensorrt·cuda·anaconda·cudnn
曾小蛙1 个月前
【ComfyUI+多视图生成】MV-Adapter:多视图一致性图片生成(2024.12.09基于SDXL开源)
sdxl·comfyui·mv-adapter·多视图生成
aworkholic3 个月前
opencv dnn模块 示例(27) 目标检测 object_detection 之 yolov11
pytorch·opencv·yolo·目标检测·dnn·tensorrt·yolo11
刘悦的技术博客4 个月前
Win11本地部署FaceFusion3最强AI换脸,集成Tensorrt10.4推理加速,让甜品显卡也能发挥生产力
ai·tensorrt·cuda
engchina4 个月前
tensorrt 下载地址
tensorrt
York19965 个月前
tensorrt python接口输出每一层的耗时
开发语言·python·tensorrt·context·myprofiler
选与握5 个月前
使用Pydot和graphviz画TensorRT的Engine图
人工智能·深度学习·tensorrt