Stable Diffusion WebUI 1.10.0来了

大家好,我是每天分享AI应用的萤火君!

前几天 AUTOMATIC1111 发布了Stable Diffusion WebUI 1.10,我也在第一时间将云环境的镜像升级到了最新版本,有兴趣的同学可以去体验下,目前已经发布到了AutoDL,镜像地址:

https://www.codewithgpu.com/i/AUTOMATIC1111/stable-diffusion-webui/yinghuoai-sd-webui-fast

这篇文章集中给大家介绍下SD WebUI 1.10的新功能和各项改进。

正式支持SD3

SD3开源发布有段时间了,ComfyUI最先提供了支持,SD WebUI迟迟没有支持,其实 AUTOMATIC1111 很早就提供了SD3的WebUI开发版,只是没有正式发布。1.10 版本正式支持了SD3。

使用方式和SD1.5、SDXL模型一样,选择SD3的模型,点击生成就可以了。注意采样器目前只支持 Euler,选择其它采样器效果很差。

另外SD3引入了新的文本编码器,出图效果更好,但是占用的显存也很可观,所以默认没有开启。显存不差钱的同学可以在设置中打开,操作步骤如下图所示。

SD3的发展并不顺利,前期因为授权协议的问题被C站封掉,又因为生成人体畸形的问题被大家疯狂吐槽,目前社区的支持正在逐步推进,真正大范围铺开可能还需要比较长的一段时间,毕竟SD1.5还是能满足很多用户的需求。

需要SD3模型的同学,可以给公/众\号"萤火遛AI"发消息"SD3"获取。

新增采样调度器

Stable Diffusion WebUI 1.10 引入了几个新的采样调度器。

Align Your Steps

适合 SDXL 和 SD 1.5,使用交大步长时的推荐插值方法。与Karras、Exponential的对比,搭配祖先采样器时表现更为明显。

KL Optimal

和 Align Your Steps 类似,基于同样的理论基础。

Normal、DDIM和Simple

从 ComfyUI 移植过来的调度器。

Beta

在去噪的开始和结束阶段花费更多时间以提高图像质量,效果和Uniform差不多,但是比Uniform更稳定。采样步数较少时效果不佳,增加至20以上时,效果稳定。

新增采样器

增加新的采样器DDIM CFG++,它是从DDIM改进而来的,主要变化是使用无条件噪声来指导去噪,而不是条件噪声。CFG++ 解决了低指导尺度的问题,提高了文本到图像的质量和可逆性。

跳过CFG

CFG在采样的前期步骤(高噪声水平)明显有害,在采样的后期步骤(低噪声水平)基本不必要,只有在中间才是有益的。在采样的早期步骤跳过CFG可以提高样本的多样性、图像质量,在某些情况下还可以更快地收敛。

按照下图中的步骤即可在页面顶部打开一个跳过CFG的开关,大家按照需要设置就可以了。

其它更多内容

次要更新:

  • 添加 --models-dir 选项来指定模型目录。 ([#15742])
  • 允许移动用户使用两指按压打开上下文菜单。 ([#15682])
  • Infotext:为捆绑的 Textual Inversion 添加 LoRA 名称作为 TI (Textual Inversion) 哈希值。 ([#15679])
  • 下载模型后检查其哈希值以防止下载损坏。 ([#15602])
  • 更多扩展标签过滤选项。 ([#15627])
  • 保存 AVIF 时使用 JPEG 的质量设置。 ([#15610])
  • 添加文件名模式:[basename]。 ([#15978])
  • 添加选项以在 SDXL 上为 CLIP L 启用 clip 跳过。 ([#15992])
  • 选项:在生成过程中防止屏幕休眠。 ([#16001])
  • 图像查看器中的 ToggleLivePreview 按钮。 ([#16065])
  • 移除在重新加载和快速滚动时的 UI 闪烁。 ([#16153])
  • 选项:禁用将按钮日志保存到 log.csv。 ([#16242])

扩展和 API:

  • 添加 process_before_every_sampling 钩子。 ([#15984])
  • 在无效的采样器错误时返回 HTTP 400 代替 404。 ([#16140])

性能:

  • [性能 1/6] 禁用 use_checkpoint。 ([#15803])
  • [性能 2/6] 用 PyTorch 原生操作替换 einops.rearrange。 ([#15804])
  • [性能 4/6] 预计算 is_sdxl_inpaint 标记。 ([#15806])
  • [性能 5/6] 防止不必要的额外网络偏置备份。 ([#15816])
  • [性能 6/6] 添加 --precision half 选项以避免推理期间的类型转换。 ([#15820])
  • [性能] LDM 优化补丁。 ([#15824])
  • [性能] 将 sigmas 保持在 CPU 上。 ([#15823])
  • 仅在所有步骤完成后检查 U-Net 中的 NaN 值。
  • 添加选项以在图像生成时运行 PyTorch 分析器。

Bug 修复:

  • 修复无全面 Infotext 的网格。 ([#15958])
  • 功能:LoRA 部分更新优先于完整更新。 ([#15943])
  • 修复在某些情况下文件扩展名具有额外的点号。 ([#15893])
  • 修复模型初始加载循环中的错误。 ([#15600])
  • 允许 API 中使用旧的采样器名称。 ([#15656])
  • 更多旧采样器调度兼容性。 ([#15681])
  • 修复 Hypertile XYZ。 ([#15831])
  • XYZ CSV skipinitialspace 选项。 ([#15832])
  • 修复 mps 和 xpu 上的软 Inpainting,torch_utils.float64。 ([#15815])
  • 修复不在主分支时的扩展更新。 ([#15797])
  • 更新 pickle 安全文件名。
  • 在 webui-assets CSS 中使用相对路径。 ([#15757])
  • 创建虚拟环境时,在 webui.bat/webui.sh 中升级 pip。 ([#15750])
  • 修复 AttributeError。 ([#15738])
  • launch_utils 中使用 script_path 作为 webui 根目录。 ([#15705])
  • 修复额外批处理模式 P 透明度。 ([#15664])
  • 在 CSS 中使用 Gradio 主题颜色。 ([#15680])
  • 修复在提示输入框内拖拽文本。 ([#15657])
  • .mjs 文件添加正确的 MIME 类型。 ([#15654])
  • QOL 项目:更干净地处理 SD 模型、LoRAs 和嵌入的元数据问题。 ([#15632])
  • wslpathexplorer.exe 替换 wsl-open。 ([#15968])
  • 修复 SDXL Inpaint。 ([#15976])
  • 多尺寸网格。 ([#15988])
  • 修复预览替换。 ([#16118])
  • 可能修复权重分解中的错误缩放。 ([#16151])
  • 确保在 Mac 和 Linux 上使用来自虚拟环境的 Python。 ([#16116])
  • 如果同时可用,则优先使用 Python 3.10 而不是 Python 3(带回退)。 ([#16092])
  • 停止生成额外内容。 ([#16085])
  • 修复 SD2 加载。 ([#16078], [#16079])
  • 修复用于高分辨率修复的不同 LoRA 的 Infotext LoRA 哈希值。 ([#16062])
  • 修复采样器调度自动修正警告。 ([#16054])
  • 移除在重新加载和快速滚动时的 UI 闪烁。 ([#16153])
  • 修复放大逻辑。 ([#16239])
  • [bug] 在非任务操作时不破坏进度条(添加 wrap_gradio_call_no_job)。 ([#16202])
  • 修复 OSError: cannot write mode P as JPEG。 ([#16194])

其他:

  • 修复变更日志编号 #15883 -> #15882。 ([#15907])
  • 重载 UI 背景颜色 --background-fill-primary。 ([#15864])
  • 对 Intel 和 ARM Macs 使用不同的 PyTorch 版本。 ([#15851])
  • XYZ 重写。 ([#15836])
  • 滚动扩展表格以适应溢出。 ([#15830])
  • img2img 批量上传方法。 ([#15817])
  • 例行工作:根据变更日志同步 v1.8.0 包。 ([#15783])
  • 添加 AVIF MIME 类型支持。 ([#15739])
  • 更新 imageviewer.js。 ([#15730])
  • no-referrer。 ([#15641])
  • .gitignore 中忽略 trace.json。 ([#15980])
  • 将 spandrel 升级至 0.3.4。 ([#16144])
  • 废弃 --max-batch-count。 ([#16119])
  • 文档:更新 bug_report.yml。 ([#16102])
  • 维护 Python 3.9 用户的项目兼容性,无需升级要求。 ([#16088], [#16169], [#16192])
  • 更新 ARM Macs 上的 PyTorch 至 2.3.1。 ([#16059])
  • 移除已废弃的设置 dont_fix_second_order_samplers_schedule。 ([#16061])
  • 例行工作:修复拼写错误。 ([#16060])
  • 在控制台日志中使用 shlex.join 合并启动参数。 ([#16170])
  • 激活虚拟环境的 .bat 文件。 ([#16231])
  • 为 img2img 中的调整大小选项添加 ID。 ([#16218])
  • 更新 Linux 安装指南。 ([#16178])
  • 强健的 sysinfo。 ([#16173])
  • 在粘贴 Inpaint 时不要发送图像大小。 ([#16180])
  • 修复 MacOS 上嘈杂的 DS_Store 文件。 ([#16166])

资源下载

文章中使用的SD模型、Lora模型、SD插件、示例图片等,都已经上传到我整理的 Stable Diffusion 绘画资源中,最新下载地址可给公/众\号 yinghuo6ai 发消息:SD,即可获取。

另外我创建了一个AI绘画专栏,更多的工作流、模型等资源会发布在这个专栏中。加入专栏,还可以零门槛,全面系统的学习 Stable Diffusion 创作,让灵感轻松落地!如有需要请点击链接进入:https://xiaobot.net/post/03340243-9df6-4ea0-bad6-9911a5034bd6


以上就是本文的主要内容,如有问题,欢迎留言!

相关推荐
少说多想勤做1 小时前
【计算机视觉前沿研究 热点 顶会】ECCV 2024中Mamba有关的论文
人工智能·计算机视觉·目标跟踪·论文笔记·mamba·状态空间模型·eccv
宜向华2 小时前
opencv 实现两个图片的拼接去重功能
人工智能·opencv·计算机视觉
OpenVINO生态社区2 小时前
【了解ADC差分非线性(DNL)错误】
人工智能
醉后才知酒浓3 小时前
图像处理之蒸馏
图像处理·人工智能·深度学习·计算机视觉
炸弹气旋3 小时前
基于CNN卷积神经网络迁移学习的图像识别实现
人工智能·深度学习·神经网络·计算机视觉·cnn·自动驾驶·迁移学习
python_知世3 小时前
时下改变AI的6大NLP语言模型
人工智能·深度学习·自然语言处理·nlp·大语言模型·ai大模型·大模型应用
愤怒的可乐3 小时前
Sentence-BERT实现文本匹配【CoSENT损失】
人工智能·深度学习·bert
冻感糕人~4 小时前
HRGraph: 利用大型语言模型(LLMs)构建基于信息传播的HR数据知识图谱与职位推荐
人工智能·深度学习·自然语言处理·知识图谱·ai大模型·llms·大模型应用
花生糖@4 小时前
Midjourney即将推出的AI生视频产品:CEO洞见分享
人工智能·ai·aigc·midjourney
小言从不摸鱼4 小时前
【NLP自然语言处理】文本处理的基本方法
人工智能·python·自然语言处理