【深度学习】sdxl中的 text_encoder text_encoder_2 区别

镜像问题是:https://editor.csdn.net/md/?articleId=135867689

代码仓库:

https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0/tree/main

截图:

为什么有两个CLIP编码器 text_encoder text_encoder_2

在仔细阅读这些代码后,我们了解到 text_encoder_2 主要是用于 refiner 模型的。

bash 复制代码
        if 'clip' in self.stages:
            subfolder = 'text_encoder'
            self.models['clip'] = CLIPModel(**models_args, embedding_dim=get_clip_embedding_dim(self.version, self.pipeline_type), output_hidden_states=self.config.get('clip_hidden_states', False), subfolder=subfolder)

        if 'clip2' in self.stages:
            subfolder = 'text_encoder_2'
            self.models['clip2'] = CLIPWithProjModel(**models_args, output_hidden_states=self.config.get('clip_hidden_states', False), subfolder=subfolder)
相关推荐
ejinxian19 小时前
谷歌发布 Project Genie:基于文本生成可互动 3D 虚拟世界
人工智能·3d·project genie
Promise微笑19 小时前
信任重构与AI采信:深度解析“两大核心+四轮驱动”Geo优化新范式
人工智能·重构
光羽隹衡19 小时前
计算机视觉——Opencv(角点检测和特征提取)
人工智能·opencv·计算机视觉
小饼干超人19 小时前
pytorch返回张量元素总数量的方法 x.numel()
人工智能·pytorch·python
啊巴矲19 小时前
小白从零开始勇闯人工智能:计算机视觉初级篇(OpenCV综合实战(上))
人工智能·opencv·计算机视觉
薛不痒19 小时前
计算机视觉opencv之人脸识别1
人工智能·opencv·计算机视觉
Godspeed Zhao19 小时前
自动驾驶中的传感器技术89——Sensor Fusion(12)
人工智能·机器学习·自动驾驶
Dfreedom.19 小时前
详解四大格式(PIL/OpenCV/NumPy/PyTorch)的转换原理与场景选择
图像处理·人工智能·pytorch·opencv·numpy·pillow
有Li19 小时前
3D CT图像的MedLSAM:定位并分割任何模型/文献速递-基于人工智能的医学影像技术
人工智能·深度学习·计算机视觉
qwy71522925816319 小时前
15-轨迹栏作为调色板
人工智能·opencv·计算机视觉