5-29 有趣的指令Pix2Pix(P2P)

前言:

上一节我们介绍了ControlNet中使用IP-Adapter能力

本节主要介绍ControlNet中的指令P2P。

全称Pix2Pix,顾名思义是针对Pixel像素级别的操作和影响。实际上通俗的理解,我们可以认为,编写一个指令,去影响这个最终图片。

有点和Reference类似,不同的是一个通过图片,一个是通过文字,或者说指令。但最终形成的都是RA/SD处理过程中参考对象的内容或者数据。所以原理是一样的。

知识点:

  1. 指令P2P

基础官方知识:

使用 Instruct Pix2Pix 控制稳定的扩散。

模型文件:control_v11e_sd15_ip2p.pth

配置文件:control_v11e_sd15_ip2p.yaml

这是一个在Instruct Pix2Pix 数据集上训练的控制网络。

与官方的 Instruct Pix2Pix 不同,该模型是用 50% 指令提示和 50% 描述提示进行训练的。例如,"一个可爱的男孩"是描述提示,而"让男孩可爱"是指令提示。

因为这是一个 ControlNet,所以您无需为原始 IP2P 的双 cfg 调整而烦恼。并且,该模型可以应用于任何基本模型。

另外,"将其变成 X"之类的指令似乎比"将 Y 变成 X"效果更好。

使用随机种子 12345 进行非精心挑选的批次测试("使其着火"):

实战

这次我们学习用ControlNet中的 InstructP2P 类型。

关键字这里给它指令 【让它着火】 或 对等英文 set it on fire,

选择一个建筑物的原图, ControlNet配置类型

结果出来的图片, 真的着火了。。。。。可以看到,大火的结构样子还是和这个建筑物有点关系的。 。

这样看来,你给的指令可以有很多。比如让2个人打架。。。。

作为对比, 如果没有ControlNet的参考图控制, 则出来的结果啥也不是

RA/SD 衍生者AI训练营

相关推荐
FIT2CLOUD飞致云4 小时前
学习笔记丨MaxKB Office Word AI翻译加载项的实现
人工智能·ai·开源·智能体·maxkb
机器视觉的发动机4 小时前
从实验室到工业现场:机器人视觉感知系统的边缘AI架构实战, 深度解析硬件选型、TensorRT量化加速与多传感器融合的极致优化方案
人工智能·机器人·视觉检测·人机交互·机器视觉
雾削木5 小时前
AI文献提示词prompts
人工智能
~kiss~5 小时前
大模型中激活函数、前馈神经网络 (FFN) 的本质
人工智能·深度学习·神经网络
老兵发新帖5 小时前
推理平台ONNX性能对比PyTorch原生格式
人工智能
犀思云5 小时前
企业端到端NaaS连接的优势与应用
网络·人工智能·机器人·智能仓储·专线
Keep_Trying_Go5 小时前
基于GAN的文生图算法详解ControlGAN(Controllable Text-to-Image Generation)
人工智能·python·深度学习·神经网络·机器学习·生成对抗网络·文生图
Spey_Events5 小时前
星箭聚力启盛会,2026第二届商业航天产业发展大会暨商业航天展即将开幕!
大数据·人工智能
JoySSLLian5 小时前
IP SSL证书:一键解锁IP通信安全,高效抵御网络威胁!
网络·人工智能·网络协议·tcp/ip·ssl
AC赳赳老秦5 小时前
专利附图说明:DeepSeek生成的专业技术描述与权利要求书细化
大数据·人工智能·kafka·区块链·数据库开发·数据库架构·deepseek