Stable Diffusion 常用大模型及其特点

SD(Stable Diffusion)的常用大模型及其特点可以归纳如下:

一、基础大模型

  1. SD 1.x

    • 特点:Stable Diffusion的早期版本,主要用于图像生成任务。这里的1.x表示1系列的主要版本,x是一个变量,表示具体的子版本。
  2. SD 2.x

    • 特点:SD 1.x的后续版本,对模型进行了优化和改进,提高了图像生成质量和速度。2.x表示2系列的主要版本,x同样是一个变量,表示具体的子版本。
  3. SD 1.5

    • 特点:在SD 1.x基础上进行优化的版本,在文本到图像生成任务上表现尤为出色,能够生成更符合用户需求的图像。
  4. SDXL 1.0

    • 特点:在SD 1.5基础上进一步优化的版本,采用了"对抗性扩散蒸馏"(Adversarial Diffusion Distillation,简称ADD)新技术,使得模型能够在保持高采样保真度的同时实现实时图像生成。
  5. SDXL Turbo

    • 特点:在SDXL 1.0的基础上进行迭代的版本,生成图像的效率非常高,几乎可以做到实时响应。同时,生成的图像质量也非常高,能够精准还原提示文本的描述。目前它只能生成固定像素的图片,对于一些细节可能表现的不够好,如人的手指、面部表情等,无法完美的展现照片级真实感。另外,目前SDXL Turbo只能用于学术研究,还未开放商业权限。

二、以SD基础模型进行训练和优化的其他模型

  1. majicMIX realistic

    • 特点:专门用于生成唯美的人像图片,目前已更新至第七版。融合了多种模型,能够生成具有吸引力的面部特征,并能有效地处理暗部细节。
  2. ChilloutMix

    • 特点:专为生成逼真的亚洲人物形象而设计,在生成高质量人物图像方面表现出色。
  3. AnythingElse V4

    • 特点:主要生成高质量的二次元和动漫图像,虽然风格相对较为单一,但在动漫领域表现出色。
  4. GuoFeng3

    • 特点:主要用于生成具有中国华丽古风风格的图像,在古风游戏角色和场景生成方面具有优势。
  5. RongHua

    • 特点:另一个国风系列模型,专注于生成具有中国特色的服装、道具和化妆元素,在国风创作领域具有较高的评价。
  6. Dreamlike-photoreal-2.0

    • 特点:用于生成逼真的场景和物品,在生成高质量的现实世界图像方面具有优势。
  7. Counterfeit

    • 特点:包括2.0、2.5、3.0版本,是安全可靠的模型。可生成逼真动漫风格的图像,适合动漫创作、游戏设计、动漫表情包制作等。
  8. Lyriel

    • 特点:包括v1.6~v1.0版本,是少数的全能大模型。用于肖像和全身动漫风格的照片,在创造奇幻景观方面和无敌光源也表现得非常不错。
  9. DreamShaper

    • 特点:同样是全能大模型,可以生成人物和场景风景,还有2.5D等。
  10. Protogen

    • 特点:包括v2.2和x3.4版本,v2.2偏向数字绘画,x3.4更偏向真人。可以通过提示词精确控制相机位置和人物动作。
  11. Dreamlike

    • 特点:以绚烂的色彩和风格而闻名,1.0偏向插画风格,2.0偏向真实照片,质感非常给力。

三、其他相关模型

  1. Checkpoint模型

    • 特点:通过Dreambooth训练方式得到的大模型,出图效果好,但训练速度普遍较慢,生成模型文件较大。
  2. LoRA模型

    • 特点:一种轻量化的模型微调训练方法,在原有大模型的基础上进行微调,用于输出固定特征的人或事物。出图效果好,训练速度快,模型文件小。
  3. Textual Inversion模型

    • 特点:使用文本提示来训练模型的方法,可以简单理解为一组打包的提示词,用于生成固定特征的人或事物。模型文件非常小,但训练速度较慢。
  4. Hypernetwork模型

    • 特点:与LoRA类似,但模型效果不如LoRA。
  5. VAE模型

    • 特点:作用是提升图像色彩效果,让画面看上去不会那么灰蒙蒙,此外还能对图像细节进行细微调整。

综上所述,SD的常用大模型种类繁多,各有特点。用户可以根据具体需求选择合适的模型进行图像生成或相关任务的处理。

相关推荐
sp_fyf_20241 分钟前
计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-10-04
人工智能·深度学习·算法·机器学习·计算机视觉·语言模型·数据挖掘
云樱梦海14 分钟前
OpenAI 推出 Canvas 工具,助力用户与 ChatGPT 协作写作和编程
人工智能·chatgpt·canvas
小白熊_XBX27 分钟前
机器学习可视化教程——混淆矩阵与回归图
人工智能·python·机器学习·矩阵·回归·sklearn
_.Switch1 小时前
自动机器学习(AutoML):实战项目中的应用与实现
人工智能·python·机器学习·自然语言处理·架构·scikit-learn
肖遥Janic1 小时前
Stable Diffusion绘画 | 插件-Deforum:动态视频生成(终篇)
人工智能·ai·ai作画·stable diffusion
念啊啊啊啊丶1 小时前
【AIGC】2021-arXiv-LoRA:大型语言模型的低秩自适应
人工智能·深度学习·神经网络·机器学习·自然语言处理
柠檬少少开发2 小时前
基于matlab的语音信号处理
人工智能·语音识别
要养家的程序猿2 小时前
上海AI Lab视频生成大模型书生.筑梦环境搭建&推理测试
人工智能·音视频
凭栏落花侧2 小时前
数据挖掘中的常见误区与注意事项
人工智能·数据挖掘
ζั͡ޓއއއ坏尐絯2 小时前
深度学习(7):RNN实战之人名的国籍预测
人工智能·rnn·深度学习