【T2I】R&B: REGION AND BOUNDARY AWARE ZERO-SHOT GROUNDED TEXT-TO-IMAGE GENERATIONCODE: 2309 https://github.com/StevenShaw1999/RnB近期的文本到图像(T2I)扩散模型在以文本提示作为输入生成高质量图像方面取得了显著进展。然而,这些模型无法传达布局指令所指定的合适空间构图。在这项工作中,我们探索了使用扩散模型进行零样本接地T2I生成,即无需训练辅助模块或微调扩散模型就能生成与输入布局信息相对应的图像。我们提出了一种区域与边界(R&B)感知的交叉注意力引导方法,该方法在生成过程中逐步调整扩散模型的注意力图,并协助模型合成高保真、与文本输入高度兼