【深度学习】sdxl中的 text_encoder text_encoder_2 区别

镜像问题是:https://editor.csdn.net/md/?articleId=135867689

代码仓库:

https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0/tree/main

截图:

为什么有两个CLIP编码器 text_encoder text_encoder_2

在仔细阅读这些代码后,我们了解到 text_encoder_2 主要是用于 refiner 模型的。

bash 复制代码
        if 'clip' in self.stages:
            subfolder = 'text_encoder'
            self.models['clip'] = CLIPModel(**models_args, embedding_dim=get_clip_embedding_dim(self.version, self.pipeline_type), output_hidden_states=self.config.get('clip_hidden_states', False), subfolder=subfolder)

        if 'clip2' in self.stages:
            subfolder = 'text_encoder_2'
            self.models['clip2'] = CLIPWithProjModel(**models_args, output_hidden_states=self.config.get('clip_hidden_states', False), subfolder=subfolder)
相关推荐
dxnb2217 小时前
Datawhale26年1月组队学习:Agentic AI+Task1工作流简介
人工智能·学习
aitoolhub17 小时前
H5交互设计:从策划到上线的实用方法论与避坑要点
人工智能·计算机视觉·交互·视觉传达
冰西瓜60017 小时前
从项目入手机器学习——(一)数据预处理(上)
人工智能·机器学习
EasyCVR17 小时前
视频融合平台EasyCVR构建太阳能供电远程视频监控系统的智慧中枢
人工智能·音视频
星浩AI17 小时前
深入理解 LlamaIndex:RAG 框架核心概念与实践
人工智能·后端·python
汤姆yu17 小时前
基于深度学习的火焰烟雾识别系统
人工智能·深度学习·目标跟踪
灯下夜无眠17 小时前
sklearn中fit、transform、fit_transform用法详解
人工智能·python·sklearn
张彦峰ZYF17 小时前
多模态大模型、混合专家模型与云端协同架构
人工智能·计算机视觉·多模态大模型·混合专家架构·大小模型协同架构
丝斯201117 小时前
AI学习笔记整理(43)——NLP之大规模预训练模型BERT
人工智能·学习·自然语言处理