AI大模型学习十八、利用Dify+deepseekR1 +本地部署Stable Diffusion搭建 AI 图片生成应用

一、说明

最近在学习Dify工作流的一些玩法,下面将介绍一下Dify + Stable Diffusion实现文生图工作流的应用方法

Dify与Stable Diffusion的协同价值

  1. Dify作为低代码AI开发平台的优势:可视化编排、API快速集成

  2. Stable Diffusion的核心能力:高效文生图、多模态生成

  3. 二者结合的意义:降低AI绘画开发门槛,加速创意落地

二、安装Stable-Diffusion-WebUI

参考文章

(七)腾讯cloudstudio+Stable-Diffusion-webui AI绘画教程-安装Stable-Diffusion-WebUI_cloudstudio怎么打开webui-CSDN博客https://blog.csdn.net/jiangkp/article/details/144322367?spm=1011.2415.3001.5331

其中 5、修改部分代码

复制代码
webui-user.sh
export COMMANDLINE_ARGS="--api --listen --enable-insecure-extension-access --xformers"

我已经重新安装了一遍,所以没问题

这篇文章是用了透传,我们这里不用透传,地址后面会给出

下载国风3

xiaolxl/GuoFeng3 at mainhttps://hf-mirror.com/xiaolxl/GuoFeng3/tree/main

地址为

https://gzwqtc--7860.ap-beijing.cloudstudio.work/

三、文生图工作流(SD工具)

1、创建SD工具

2、创建应用发布为工具

3、通过大模型将自然语言转换成SD提示词

点击保存

修改之后的图

上面在调试是不好调试,我们可以不按照上图填写,按下图,可以在llm中直接输入调试

系统提示词

角色

你是一个专业的SD提示词提取专家,擅长从描述性画面中精准提取SD提示词。

技能

技能 1: 提取SD提示词

  1. 当用户提供描述性画面时,仔细分析画面内容。

  2. 精准提取其中与SD相关的提示词。

  3. 将提取的提示词清晰罗列展示给用户。

  4. 提示词内容用逗号隔开。

===回复示例===

1gril,street

===示例结束===

技能 2: 提示词转换

将具体的提示词转换成stable diffusion能够识别的字符

限制:

  • 只围绕从描述性画面中提取SD提示词展开,拒绝回答无关话题。

  • 所输出的内容必须清晰罗列展示提取的提示词,不能偏离框架要求。

测试LLM

提示词:

月光下的少女,红色头发,白色连衣裙,以及夜晚,在海边

4、 使用Stable Diffusion工具生成图片

添加第三个节点

参数修改,可以看stable diffusion的说明

单个节点测试一下

添加end节点

添加输出变量

5、测试

剩下的就是等

生成的图片不准啊

我准备用国风3.3或3.4看看 下载好慢喔

xiaolxl/GuoFeng3 at mainhttps://hf-mirror.com/xiaolxl/GuoFeng3/tree/main

选择为国风3.3

测试步骤河上面一样

提示词改一下

一天晚上,在海边,月光下的少女,红色头发,白色连衣裙,

还是没有海边啊

换为国风3.4版本

更换版本后,第一次运行会出错误,主要是后台有一个更换模型的过程,第二次运行就好了

提取的SD提示词:

moonlight, beach, girl, red hair, white dress

再来一次,这个好像可以有海了

四、发布为工具

发布为工具可以在其它应用中使用

配置下,就可以了 ,没啥按要求填

五、创建应用

再创建一个应用,应用工具即可,就不写文档了,前面不足差不多一个开始,一个调用工具,一个结束,

相关推荐
薛定猫AI几秒前
【深度解析】从 Antigravity 2.0 看 AI Agent 的产品化演进:动态子代理、项目工作区与多模型编排实战
人工智能
2的n次方_几秒前
健身 Agent:不止视频,更有 AI 人物实时跟练交互
人工智能·音视频·交互·魔珐星云
前端不太难1 分钟前
CPU+GPU:开启AI推理新时代
人工智能·状态模式
chian-ocean1 分钟前
创业者实操:10 分钟搭建可商业化的交互型 AI 家电导购产品
人工智能
海上彼尚2 分钟前
Nodejs也能写Agent - 6.基础篇 - Agent
前端·人工智能·后端·node.js
viperrrrrrrrrr73 分钟前
强化学习入门笔记
人工智能·强化学习
轻刀快马3 分钟前
AI 架构的文艺复兴:用操作系统“内存管理”重构 LLM 状态机 —— 深度解密 Claude Code
人工智能·架构
随身数智备忘录3 分钟前
拆解安全生产法三大核心功能,安全生产法如何解决责任不清与事故追责难
大数据·人工智能·安全
子榆.4 分钟前
CANN PyTorch适配器深度拆解:从.cuda()到.npu()到底发生了什么
人工智能·pytorch·python
renhongxia16 分钟前
从GPT到开源大模型
人工智能·gpt·生成对抗网络·语言模型·自然语言处理·开源