Stable Diffusion绘画 | 来训练属于自己的模型:素材准备篇

首先要说明的是,模型训练,需要显卡持续不间断地一致运行,

快则0.5-1小时左右,慢的话可能需要跑上几小时,甚至是几天,

原因跟显卡的配置和训练设置参数都有关系。

模型训练与显卡配置:

  • 训练 LoRA模型:要求6GB显存及以上

  • 训练 Checkpoint:要求8GB显存及以上

  • 训练 SDXL模型:要求16GB显存及以上

因此,从显卡配置角度来看,更推荐训练 LoRA模型,而且训练 LoRA模型 比其他的要快上很多。

我们利用训练好的 LoRA模型,搭配合适的大模型,也能轻松实现各种定制的风格效果。

素材准备

确定模型主题

确认主题,有利于我们围绕模型的核心特点来准备素材,提供给AI学习。

我们所收集到的图片质量好与坏,直接影响模型的最终效果。

图片数量

这需要匹配模型风格来确定:

  • 训练通用性较强的模型:需要提供较多的图片素材,数量可以达到100张以上
  • 训练单一风格/指定角色的模型:至少需要提供20张图片素材

素材图片并非越多越好,图片过多,会增加训练时长,以及处理图片的工作量;

相反,图片过少,AI学习信息不足,从而导致生成的画面不拟合,描述词一改就达不到想要的效果了。

图片质量

首先,要确保图片清晰度;

其次,要确保图片的全面性;

以训练人物模型举例,需要准备以下的图片素材,包括:

  • 不同角度,表情
  • 不同姿势,光影
  • 面部特写照
  • 半身照
  • 全身照

最后,要注意图片中的细节:

  • 不要在素材文件夹中放置一样的图片,会影响AI的学习
  • 不要挑选主体被遮挡的图片
  • 应尽可能突出主体,不要挑选背景太花太复杂的图片

今天先分享到这里~


开启实践: SD绘画 | 为你所做的学习过滤

相关推荐
007tg2 小时前
从ChatGPT家长控制功能看AI合规与技术应对策略
人工智能·chatgpt·企业数据安全
Memene摸鱼日报2 小时前
「Memene 摸鱼日报 2025.9.11」腾讯推出命令行编程工具 CodeBuddy Code, ChatGPT 开发者模式迎来 MCP 全面支持
人工智能·chatgpt·agi
linjoe993 小时前
【Deep Learning】Ubuntu配置深度学习环境
人工智能·深度学习·ubuntu
先做个垃圾出来………4 小时前
残差连接的概念与作用
人工智能·算法·机器学习·语言模型·自然语言处理
AI小书房4 小时前
【人工智能通识专栏】第十三讲:图像处理
人工智能
fanstuck4 小时前
基于大模型的个性化推荐系统实现探索与应用
大数据·人工智能·语言模型·数据挖掘
多看书少吃饭6 小时前
基于 OpenCV 的眼球识别算法以及青光眼算法识别
人工智能·opencv·计算机视觉
m0_603888716 小时前
Prototype-Aware Multimodal Alignment for Open-Vocabulary Visual Grounding
ai·原型模式·论文速览
一条数据库6 小时前
南京方言数据集|300小时高质量自然对话音频|专业录音棚采集|方言语音识别模型训练|情感计算研究|方言保护文化遗产数字化|语音情感识别|方言对话系统开发
人工智能·音视频·语音识别