diffusion model: prompt-to-prompt 深度剖析

参考:diffusion model(十四): prompt-to-prompt 深度剖析-CSDN博客

P2P提出的Motivation

目前大火的文生图技术(text to image),给定一段文本(prompt)和随机种子,文生图模型会基于这两者生成一张图片。生成图片的不同由两个变量决定

随机种子:随机种子决定初始的噪声
prompt:prompt是通过文本编码器(如CLIP的text encoder)转为语义向量再送入到diffusion model的cross-attention层中与图片信息交互。

相关推荐
alex1001 小时前
AI Agent开发学习系列 - langchain之LCEL(5):如何创建一个Agent?
人工智能·python·语言模型·langchain·prompt·向量数据库·ai agent
liliangcsdn4 小时前
mac测试ollama llamaindex
数据仓库·人工智能·prompt·llama
旧曲重听12 天前
基于Prompt 的DevOps 与终端重塑
人工智能·prompt·devops
AIGC包拥它3 天前
RAG项目实战:LangChain 0.3集成 Milvus 2.5向量数据库,构建大模型智能应用
人工智能·python·langchain·prompt·个人开发·milvus
so.far_away4 天前
The Survey of Few-shot Prompt Learning on Graph
prompt
Xy-unu4 天前
[Semantic Seg][KD]FreeKD: Knowledge Distillation via Semantic Frequency Prompt
prompt
寒水馨5 天前
构建企业级 AI Agent:不只是 Prompt 工程,更是系统工程
人工智能·ai·prompt·agent·ai agent·ai工程
semantist@语校6 天前
面向向量检索的教育QA建模:九段日本文化研究所日本语学院的Prompt策略分析(6 / 500)
人工智能·支持向量机·百度·ai·开源·prompt·数据集
Chan166 天前
【 SpringAI核心特性 | Prompt工程 】
java·spring boot·后端·spring·prompt·ai编程
喜欢猪猪6 天前
Qwen3-8B 的 TTFT 性能分析:16K 与 32K 输入 Prompt 的推算公式与底层原理详解
prompt