text2img

Akttt1 天前
人工智能·深度学习·计算机视觉·text2img
【T2I】R&B: REGION AND BOUNDARY AWARE ZERO-SHOT GROUNDED TEXT-TO-IMAGE GENERATIONCODE: 2309 https://github.com/StevenShaw1999/RnB近期的文本到图像(T2I)扩散模型在以文本提示作为输入生成高质量图像方面取得了显著进展。然而,这些模型无法传达布局指令所指定的合适空间构图。在这项工作中,我们探索了使用扩散模型进行零样本接地T2I生成,即无需训练辅助模块或微调扩散模型就能生成与输入布局信息相对应的图像。我们提出了一种区域与边界(R&B)感知的交叉注意力引导方法,该方法在生成过程中逐步调整扩散模型的注意力图,并协助模型合成高保真、与文本输入高度兼
Akttt2 个月前
人工智能·计算机视觉·text2img
【T2I】DreamBench++: A Human-Aligned Benchmark for Personalized Image GenerationCODE:ICLR 2025yuangpeng/dreambench_plus: [ICLR 2025] Official code implementation of DreamBench++: A Human-Aligned Benchmark for Personalized Image Generation
Akttt3 个月前
text2img
【T2I】Divide & Bind Your Attention for Improved Generative Semantic NursingCODE:GitHub - boschresearch/Divide-and-Bind: Official implementation of "Divide & Bind Your Attention for Improved Generative Semantic Nursing" (BMVC 2023 Oral)
庞德公1 年前
人工智能·stable diffusion·midjourney·flux·text2img
Flux:Midjourney的新图像模型挑战者--->更多内容,请移步“鲁班秘笈”!!<---Black Forest Labs是一家由前Stability.ai开发人员创立的AI初创公司,旨在为图像和视频创建尖端的生成式 AI 模型。这家初创公司声称,其第一个模型系列Flux.1为文本到图像的生成设定新的标准。
走召大爷2 年前
stable diffusion·pipeline·diffusers·text2img
扩散模型Diffusers Pipeline API使用介绍大部分扩散模型包含多个独立训练的子模型和组件模块组合而成,例如StableDiffusion 有:为了让开发者以最简单的方式使用最新最先进的扩散模型,diffusers开发了pipeline管理和使用这些类,使得开发者可以以端对端方式使用扩散模型。