AI大模型学习十八、利用Dify+deepseekR1 +本地部署Stable Diffusion搭建 AI 图片生成应用

一、说明

最近在学习Dify工作流的一些玩法,下面将介绍一下Dify + Stable Diffusion实现文生图工作流的应用方法

Dify与Stable Diffusion的协同价值

  1. Dify作为低代码AI开发平台的优势:可视化编排、API快速集成

  2. Stable Diffusion的核心能力:高效文生图、多模态生成

  3. 二者结合的意义:降低AI绘画开发门槛,加速创意落地

二、安装Stable-Diffusion-WebUI

参考文章

(七)腾讯cloudstudio+Stable-Diffusion-webui AI绘画教程-安装Stable-Diffusion-WebUI_cloudstudio怎么打开webui-CSDN博客https://blog.csdn.net/jiangkp/article/details/144322367?spm=1011.2415.3001.5331

其中 5、修改部分代码

复制代码
webui-user.sh
export COMMANDLINE_ARGS="--api --listen --enable-insecure-extension-access --xformers"

我已经重新安装了一遍,所以没问题

这篇文章是用了透传,我们这里不用透传,地址后面会给出

下载国风3

xiaolxl/GuoFeng3 at mainhttps://hf-mirror.com/xiaolxl/GuoFeng3/tree/main

地址为

https://gzwqtc--7860.ap-beijing.cloudstudio.work/

三、文生图工作流(SD工具)

1、创建SD工具

2、创建应用发布为工具

3、通过大模型将自然语言转换成SD提示词

点击保存

修改之后的图

上面在调试是不好调试,我们可以不按照上图填写,按下图,可以在llm中直接输入调试

系统提示词

角色

你是一个专业的SD提示词提取专家,擅长从描述性画面中精准提取SD提示词。

技能

技能 1: 提取SD提示词

  1. 当用户提供描述性画面时,仔细分析画面内容。

  2. 精准提取其中与SD相关的提示词。

  3. 将提取的提示词清晰罗列展示给用户。

  4. 提示词内容用逗号隔开。

===回复示例===

1gril,street

===示例结束===

技能 2: 提示词转换

将具体的提示词转换成stable diffusion能够识别的字符

限制:

  • 只围绕从描述性画面中提取SD提示词展开,拒绝回答无关话题。

  • 所输出的内容必须清晰罗列展示提取的提示词,不能偏离框架要求。

测试LLM

提示词:

月光下的少女,红色头发,白色连衣裙,以及夜晚,在海边

4、 使用Stable Diffusion工具生成图片

添加第三个节点

参数修改,可以看stable diffusion的说明

单个节点测试一下

添加end节点

添加输出变量

5、测试

剩下的就是等

生成的图片不准啊

我准备用国风3.3或3.4看看 下载好慢喔

xiaolxl/GuoFeng3 at mainhttps://hf-mirror.com/xiaolxl/GuoFeng3/tree/main

选择为国风3.3

测试步骤河上面一样

提示词改一下

一天晚上,在海边,月光下的少女,红色头发,白色连衣裙,

还是没有海边啊

换为国风3.4版本

更换版本后,第一次运行会出错误,主要是后台有一个更换模型的过程,第二次运行就好了

提取的SD提示词:

moonlight, beach, girl, red hair, white dress

再来一次,这个好像可以有海了

四、发布为工具

发布为工具可以在其它应用中使用

配置下,就可以了 ,没啥按要求填

五、创建应用

再创建一个应用,应用工具即可,就不写文档了,前面不足差不多一个开始,一个调用工具,一个结束,

相关推荐
努力还债的学术吗喽11 分钟前
PyTorch nn.Linear 终极详解:从零理解线性层的一切(含可视化+完整代码)
人工智能·pytorch·python·深度学习·基础组件·线性层·nn.linear
说私域32 分钟前
基于开源AI智能名片的S2B2C商城小程序中搜索联想功能的优化策略研究
人工智能·小程序
工藤学编程1 小时前
零基础学AI大模型之LangChain聊天模型多案例实战
人工智能·langchain
无风听海1 小时前
神经网络之sigmoid激活函数
人工智能·深度学习·神经网络
宸津-代码粉碎机1 小时前
Redis 进阶:跳出缓存局限!7 大核心场景的原理与工程化实践
java·人工智能·redis·python
wan5555cn1 小时前
AI视频生成技术:从想象到现实的视觉革命
人工智能·笔记·深度学习·算法·音视频
MYZR11 小时前
蓝牙音箱的技术演进:从便捷到高保真的音频革命
人工智能·物联网·音视频·ssd2351
liaomin4161005691 小时前
transformers音频实战01-音频概念
人工智能·音视频
IT_陈寒1 小时前
Python 3.12 性能暴增50%!这5个新特性让老项目直接起飞
前端·人工智能·后端
charieli-fh2 小时前
LoRA 高效微调大语言模型全流程:从原理、实践到参数调优
人工智能·深度学习·大模型·大语言模型