【ComfyUI】ChatGPT 图像描述词润色

在这里插入代码片今天带来一个用于图像描述词润色的 ComfyUI 工作流示例。它通过基础文本输入、ChatGPT 模型理解与生成、以及翻译输出,将简单的中文提示转化为细腻、专业并适用于图像生成的英文描述词,同时还能生成对应的中文回译结果。通过节点间的数据流动,你可以清楚看到从原始词句到最终成品提示词的全过程,理解工作流如何在语言润色、风格塑造和文本强化上发挥作用。

文章目录

工作流介绍

这个工作流围绕"中文提示词润色为高质量英文描述"这一核心任务构建。流程从输入原始中文文本开始,经由 ChatGPT 模型生成艺术化英文描述,再通过翻译节点转换为中文,让创作者在英文提示与中文理解之间自由切换。核心模型负责风格化文本生成,Node 节点各司其职,围绕输入、生成、展示输出三部分协同完成整套润色链路。综合来看,工作流逻辑清晰、节点调用紧密,非常适合处理图像提示词的精细化加工。

核心模型

核心模型承担提示词生成与艺术化文本扩写的任务。该模型根据系统规则,将输入中文扩写成结构严谨、细节丰富的英文描述,覆盖光影、情绪、场景、构图等多维度,让提示词更适合用于图像生成。

应用场景 推荐模型 适用原因 输出特点 使用效果
快速原型与日常润色 gpt-3.5-turbo、gpt-3.5-turbo-16k、Qwen-turbo 调用速度快,成本低,适合频繁测试与迭代 生成结果简洁流畅,适合快速验证 快速完成提示词润色与中英文转换,提高创作效率
商业插画与设计 gpt-4、gpt-4o、deepseek-chat、Qwen-max 在艺术细节、风格控制和复杂语义表达上表现突出 描述更具视觉感和艺术氛围,支持多风格 保证生成提示词的专业性和细节丰富度,适合直接应用于 AI 绘画
长文本与科研实验 moonshot-v1-32k、moonshot-v1-128k、glm-4、Yi-1.5-9B-Chat-16K 长上下文处理能力强,能处理大规模输入 支持大段输入输出,逻辑连贯,细节完整 能在科研或实验场景中对比不同润色版本,保证结果一致性
教学与研究示范 Qwen-plus、Qwen-long、glm-3-turbo 性价比高,支持长短文本任务,易于部署 语言表达清晰,支持中英文双语 用于教学案例,展示润色前后差异,辅助学生理解提示词构建逻辑
内容生产与多场景适配 gpt-4o-2024-05-13、deepseek-chat、Qwen-max-longcontext 多模态优化或长上下文能力强,适合多样化创作 支持细节扩写、多风格融合 提高内容生产效率,保证创作多样性与国际化表达

Node节点

Node 节点构成整个工作流的结构基础。从输入字符串开始,到调用模型生成文本,再到显示英文与翻译结果,各节点在流程中负责不同的任务。输入节点提供原始文本,模型节点执行润色生成,展示节点直观呈现结果,翻译节点完成双语输出。一整套链路连贯紧凑,适配提示词创作需求。

节点名称 说明
String 提供用户输入的原始中文描述词
ChatGPTOpenAI 调用 deepseek-chat 模型生成英文扩写文本
ShowText 展示英文润色结果与中文回译结果
DeepTranslatorTextNode 将英文结果翻译为中文,便于比对和理解

工作流程

整个流程围绕"输入中文提示词 → 英文艺术化润色 → 中文回译理解"展开。每个阶段的节点都承担清晰的任务,使文本在不同模块中不断被强化。从最初的原始词句,到模型生成的专业英文描述,再到翻译节点输出的中文回译,流程紧凑而直观。表格中的流程节点清楚展示了文本如何在不同处理环节中传递,帮助你理解整体链路的运作方式。

流程序号 流程阶段 工作描述 使用节点
1 文本输入 提供原始中文提示词作为后续润色的基础 String
2 文本生成 调用 deepseek-chat 模型,将中文扩写成细致英文描述 ChatGPTOpenAI
3 英文展示 显示模型生成的英文艺术化提示词 ShowText
4 中文回译 将生成的英文描述翻译为中文便于理解 DeepTranslatorTextNode
5 结果展示 显示中文回译结果,与英文形成参照 ShowText

大模型应用

ChatGPTOpenAI 节点概述

这个节点承担了整个工作流中最核心的生成任务。它接收中文提示词,根据预设的系统 Prompt,将内容扩写成细节充足、视觉化强烈的英文描述。其目标是把原始词句转化为可以直接用于图像生成的高质量英文提示词。表格中的 Prompt 内容规定了模型的写作规则、风格要求以及扩写方向,使最终输出具备艺术氛围、视觉构图、色彩细节与情绪表现等全面信息,确保生成文本稳定、专业、可直接用于创作。

节点名称 Prompt信息 说明
ChatGPTOpenAI(deepseek-chat / DeepSeek-V2) You are an AI painting assistant with rich imagination, good at describing various pictures, which are used to provide stable diffusion as prompt. I will give you a Chinese description. Please pay special attention to the style description of the picture I give. You need to describe the picture in the style I give. The main content of the picture should be as close to my description as possible. You can use your imagination to make the content of the picture richer. You must use very detailed text. Based on the original meaning of the text, use very detailed artistic techniques to describe the picture. Pay attention to the expression of emotions, the rendering of artistic atmosphere, the description of artistic scenes, the construction of artistic details, the creation of artistic themes, color description and professional color application, commercial blockbuster-level perspective selection, random and changeable perspective selection, and fashion magazine cover composition changes. The text must be written in complete paragraphs, without titles, paragraphs, and serial numbers. The text must be written in complete paragraphs. Please output the last input prompt in professional English. 该 Prompt 为模型设定了"艺术化提示词生成器"的专业角色。其目标是将简单中文扩写成具有画面感、构图逻辑、光影表现与商业审美的英文描述,使输出内容能够直接用于图像生成工作流,保证细节饱满、风格统一、视觉信息完整。

使用方法

这个大模型节点的使用方式十分简单,将原始中文提示词输入到 String 节点后,内容会自动传递到 ChatGPTOpenAI 节点,由其按照 Prompt 规则生成高质量英文描述。使用者只需提供核心语义即可,模型会将内容扩写为完整艺术化画面。生成的英文文本会显示在 ShowText 节点中,同时可以继续传递至翻译节点形成中英文对照,便于创作者快速调整提示词方向并投入后续创作。

应用场景

这个工作流非常适合需要在图像生成前进行提示词精细化处理的场景。无论是绘画创作、商业视觉、AI 模型训练还是文案前期构思,都能通过英文艺术化扩写和中文语义回译,对提示词进行增强与校准。表格总结了这些场景的使用目标与产出效果,让用户能迅速判断该工作流在实际项目中的适用性。

应用场景 使用目标 典型用户 展示内容 实现效果
图像生成提示词润色 将简短中文扩写成画面细节丰富的英文提示词 AI 绘画创作者、设计师 英文润色词 + 中文回译 获取更具画面感、结构清晰的高质量提示词
商业视觉文案强化 为广告、产品图等生成具有商业质感的英文描述 视觉设计团队、品牌方 风格化英文文本 提高视觉方向的一致性与叙事质量
训练素材描述生成 为训练集构建高质量、细节完整的英文描述 数据标注团队 标准化英文描述 得到更稳定一致的训练文本
文案前期创意扩写 将简短想法扩写成更完整的语义画面 文案、策划 扩写英文内容与中译 快速获得可用于创意思考的画面构想

开发与应用

更多 AIGC 与 ComfyUI工作流 相关研究学习内容请查阅:

ComfyUI使用教程、开发指导、资源下载

更多内容桌面应用开发和学习文档请查阅:

AIGC工具平台Tauri+Django环境开发,支持局域网使用
AIGC工具平台Tauri+Django常见错误与解决办法
AIGC工具平台Tauri+Django内容生产介绍和使用
AIGC工具平台Tauri+Django开源ComfyUI项目介绍和使用
AIGC工具平台Tauri+Django开源git项目介绍和使用

相关推荐
love530love1 天前
在 PyCharm 中配置 x64 Native Tools Command Prompt for VS 2022 作为默认终端
ide·人工智能·windows·python·pycharm·prompt·comfyui
love530love1 天前
Win11+RTX3090 亲测 · ComfyUI Hunyuan3D 全程实录 ③:diso 源码编译实战(CUDA 13.1 零降级)
开发语言·人工智能·windows·python·comfyui·hunyuan3d·diso
Mr数据杨2 天前
【ComfyUI】Wan 2.2 14B Fun Camera 镜头运动控制
comfyui
Mr数据杨2 天前
【ComfyUI】Wan2.2 ElementMorph FX 多元素变装视频
comfyui
love530love3 天前
ComfyUI 升级 v0.4.0 踩坑记录:解决 TypeError: QM_Queue.task_done() 报错
人工智能·windows·python·comfyui
懵懵爸爸5 天前
comfyui seedvr2 UnicodeDecodeError utf-8 运行错误 编译错误 最懒解决参考
comfyui·seedvr2
Mr数据杨6 天前
【ComfyUI】Animate 双人重绘场景动作迁移视频生成
comfyui
_妲己6 天前
SD的细分功能包括重绘,图像处理、放大等扩散模型应用
人工智能·python·深度学习·机器学习·stable diffusion·comfyui·ai工作流
懵懵爸爸9 天前
comfyui 安装sageattention 编译失败报错 code 1120 PyInit__qattn_sm80
comfyui·sageattention