Stable Diffusion绘画 | 文生图设置详解(二)

提示词引导系统(CFG Scale)

这里的参数,是用来控制 SD 是否严格按照输入的提示词来生成画面

CFG值越小,对 SD 的约束程度就越低,AI 会加入更多想法💡,CFG=7是一个平衡值

CFG值越大,对 SD 的约束程度就越高,AI 生成的图片会越贴近关键词

操作对比:

markdown 复制代码
1girl,wearing a fur coat,eat hot pot at a hot pot restaurant,

通过生成的图片可以发现,CFG Scale=1.0,人物所穿的并非毛皮大衣,且出图有点问题,比较糊。

当 CFG Scale=3.0 时,人物所穿的衣服比较接近提示词,基本符合是毛皮大衣。

当 CFG Scale=7.0 时,人物所穿的衣服是毛皮大衣,符合提示词的描述。

当然,CFG Scale 值并非数值越高越好,数值越高,SD 则会出现过度拟合的状态,图片中的人物会出现紫边情况:

CFG Scale 值需要稍作尝试,才能找到一个平衡点,通常建议是7-10范围内的值。

今天先分享到这里~


开启实践: SD绘画 | 为你所做的学习过滤

相关推荐
无声旅者20 分钟前
深入解析RAG技术:提升题目解答准确率的利器
ai·rag
gogoMark4 小时前
口播视频怎么剪!利用AI提高口播视频剪辑效率并增强”网感”
人工智能·音视频
2201_754918414 小时前
OpenCV 特征检测全面解析与实战应用
人工智能·opencv·计算机视觉
love530love6 小时前
Windows避坑部署CosyVoice多语言大语言模型
人工智能·windows·python·语言模型·自然语言处理·pycharm
985小水博一枚呀6 小时前
【AI大模型学习路线】第二阶段之RAG基础与架构——第七章(【项目实战】基于RAG的PDF文档助手)技术方案与架构设计?
人工智能·学习·语言模型·架构·大模型
白熊1887 小时前
【图像生成大模型】Wan2.1:下一代开源大规模视频生成模型
人工智能·计算机视觉·开源·文生图·音视频
weixin_514548897 小时前
一种开源的高斯泼溅实现库——gsplat: An Open-Source Library for Gaussian Splatting
人工智能·计算机视觉·3d
在未来等你7 小时前
互联网大厂Java求职面试:AI与大模型应用集成及云原生挑战
java·微服务·ai·kubernetes·大模型·embedding·spring ai
四口鲸鱼爱吃盐7 小时前
BMVC2023 | 多样化高层特征以提升对抗迁移性
人工智能·深度学习·cnn·vit·对抗攻击·迁移攻击
Echo``8 小时前
3:OpenCV—视频播放
图像处理·人工智能·opencv·算法·机器学习·视觉检测·音视频