丹摩征文活动 | SD3+ComfyUI的图像部署实践

一、前言

作为Stability AI 推出的一款革命性的文本转图像开源模型,Stable Diffusion 3(简称SD3)在图像质量、文本内容生成、理解复杂指令以及资源利用效率方面,都有着不俗的表现。

SD3的Medium版本,拥有20亿参数,体积精巧,即使在消费级个人电脑和笔记本上也能流畅运行,使得广大用户可以在自己的设备上轻松部署和使用。

在图像生成能力上,SD3表现卓越,能够生成细节丰富、色彩鲜明、光影效果自然的图像。它能根据指令灵活调整生成图像的风格,如动画、厚涂等。并且,用户无需进行微调,只需要输入提示词,SD3就能生成所需的图像。

值得一提的是,SD3能理解复杂的自然语言指令,包括空间逻辑、构建元素、姿态动作、风格描述等,显示出比Midjourney更为精准的文本理解能力。

而ComfyUI,则是一款以节点工作流为基础的Stable Diffusion Web用户界面,它可以支持SD3模型的运行。用户可以从GitHub上下载并安装ComfyUI。有了ComfyUI,操作SD3模型就像小菜一碟,它提供了一个极其友好的用户界面,让使用过程变得更加直观。更值得一提的是,ComfyUI支持图像的批量生成和编辑功能,让你能够轻松实现高效的批处理操作。

官网页面(可体验):

点击跳转https://www.damodel.com/home

二、部署流程

使用丹摩平台,进入控制台-GPU云实例,点击创建实例:

在创建页面中,第一步是选择适合你需求的付款方式。对于短期使用,按需计费或日付费是理想的选择,而对于长期使用,包月套餐则更经济实惠。

对于首次创建实例,推荐使用按需计费,配置1个GPU,并选择NVIDIA-GeForce-RTX-4090,这款GPU提供60GB内存和24GB显存,足以满足LLaMA3.1 8B版本所需的最低16GB显存要求。

然后,调整数据硬盘的大小。每个实例默认包含50GB的数据硬盘存储。由于FLUX.1模型占用空间较大,建议将硬盘容量扩展到150GB,以确保有足够的存储空间。这样配置将使你的实例在处理复杂任务时更加高效和稳定。

接下来,需要挑选一个合适的启动镜像,平台提供了多种预装了基础环境和框架的基础镜像,可以通过简单的勾选操作来选择所需的框架,比如PyTorch 2.4.0版本,能立即配置好您的开发环境,省去了手动安装的麻烦。

为保证安全登录,创建密钥对,输入自定义的名称,然后选择自动创建并将创建好的私钥保存的自己电脑中,以便后续本地连接使用。

创建好密钥对后,选择刚刚创建好的密钥对,并点击立即创建,等待一段时间后即可启动成功!

三、登录实例

等待实例创建成功,在 GPU云实例 中查看实例信息。

平台提供了在线访问实例的 JupyterLab 入口,可以直接登录实例:

在成功登录服务器后,您通常会被带到/root/workspace目录,对于SSH访问,可以通过多种客户端工具进行,例如系统自带的终端、Xshell或MobaXterm。

在实例管理页面,您可以轻松找到所有必要的连接详情,以便快速设置SSH连接。这样,您就可以开始管理和操作您的服务器环境了。

复制结果类似如下:

vb 复制代码
`ssh -p 31729 root@gpu-s277r6fyqd.ssh.damodel.com`

其中,gpu-s277r6fyqd.ssh.damodel.com 即主机host,31729 为端口号。

终端登录方式详见SSH登录与密钥对

四、部署ComfyUI

在终端中执行以下命令克隆ComfyUI代码:

# github官方代码仓库
git clone https://github.com/comfyanonymous/ComfyUI.git
# gitCode-github加速计划代码仓库
git clone https://gitcode.com/gh_mirrors/co/ComfyUI.git

克隆完成后可看到如下目录:

终端进入/root/workspace/ComfyUI目录,执行以下命令,安装ComfyUI需要的依赖:

cd ComfyUI/
pip install -r requirements.txt --ignore-installed

执行以下命令,启动ComfyUI:

python main.py --listen

看到服务成功启动,说明ComfyUI部署成功!

五、部署SD3

从HF-mirror下载SD3模型:

pip install -U huggingface_hub

#设置环境变量
export HF_ENDPOINT=https://hf-mirror.com
#下载模型
huggingface-cli download --token hf_BbwgWIQLalWXUdHgvDGPDZpnLxo --resume-download stabilityai/stable-diffusion-3-medium --local-dir .

六、生成效果

火焰中的炫酷猫咪

七、总结

作为一个开发者,我发现使用SD3和ComfyUI是一种极为愉快和高效的体验。SD3的精准图像控制和强大的元素合成能力让我真正实现了通过简单的提示词就能精确调控画面中的每一个细节和风格。

ComfyUI的操作简洁易懂,从启动程序、加载模型、输入提示词、调整参数到最后生成图像,整个过程就像一条清晰的流水线,非常流畅和高效。更值得一提的是,ComfyUI的批处理功能大大提升了我的工作效率。

在实际操作中,我可以深切感受到SD3和ComfyUI带来的便捷性。下载并安装ComfyUI后,我可以直接从Hugging Face下载SD3模型,并将其存放在ComfyUI的模型文件夹下,然后通过ComfyUI的启动器来加载模型并生成图像。此外,我还可以根据我的需求调整各项参数,如采样器、步骤与CFG等,来优化生成图像的质量和风格。

成功的路上没有捷径,只有不断的努力与坚持。如果你和我一样,坚信努力会带来回报,请关注我,点个赞,一起迎接更加美好的明天!你的支持是我继续前行的动力!"

"每一次创作都是一次学习的过程,文章中若有不足之处,还请大家多多包容。你的关注和点赞是对我最大的支持,也欢迎大家提出宝贵的意见和建议,让我不断进步。"

神秘泣男子

相关推荐
封步宇AIGC9 分钟前
量化交易系统开发-实时行情自动化交易-4.2.3.指数移动平均线实现
人工智能·python·机器学习·数据挖掘
Mr.谢尔比23 分钟前
李宏毅机器学习课程知识点摘要(1-5集)
人工智能·pytorch·深度学习·神经网络·算法·机器学习·计算机视觉
我是博博啦25 分钟前
matlab例题
人工智能·算法·matlab
DieYoung_Alive30 分钟前
一篇文章了解机器学习
人工智能·机器学习
2023数学建模国赛比赛资料分享32 分钟前
2024亚太杯国际赛C题宠物预测1234问完整解题思路代码+成品参考文章
人工智能·数学建模·宠物·2024亚太杯国际赛数学建模·2024亚太杯国际赛a题·2024亚太杯国际赛数模abc·2024亚太杯数学建模
思通数科AI全行业智能NLP系统41 分钟前
六大核心应用场景,解锁AI检测系统的智能安全之道
图像处理·人工智能·深度学习·安全·目标检测·计算机视觉·知识图谱
程序员小范2 小时前
孙玲:从流水线工人到谷歌程序员
人工智能·程序员·谷歌·远程工作
命里有定数2 小时前
Paper -- 洪水深度估计 -- 利用图像处理和深度神经网络绘制街道照片中的洪水深度图
图像处理·人工智能·dnn·洪水深度·高度估计
Guofu_Liao2 小时前
大语言模型中Softmax函数的计算过程及其参数描述
人工智能·语言模型·自然语言处理
非自律懒癌患者2 小时前
Transformer中的Self-Attention机制如何自然地适应于目标检测任务
人工智能·算法·目标检测