文生图大模型

Java后端何哥4 个月前
ai大模型·文生图大模型·开源大模型总结·大模型进展·qianwen
最常见的AI大模型总结前言:大模型可以根据其主要的应领域和功能,可以分类为“文生文”(Text-to-Text)、“文生图”(Text-to-Image)和“文生视频”(Text-to-Video),都是基于自然语言处理(NLP)和计算机视觉(CV)的大模型所实现的功能。这些大模型的发展极大地推动了人工智能技术在各个领域的应用,并且随着技术的进步,未来可能会出现更多创新性的应用和服务。
LuH11241 年前
论文阅读·笔记·prompt·aigc·图像编辑·文生图大模型
【论文阅读笔记】Prompt-to-Prompt Image Editing with Cross-Attention Control方法概述。论文使用了什么方法或技术?方法的创新点是什么?方法的优势和潜在劣势是什么?实施步骤设DM (zt, P, t, s)为扩散过程单步t的计算,输出噪声图像zt−1,注意图Mt(未使用省略)。用 DM (zt, P, t, s){M ← M ^ \hat{M} M^} 表示扩散步骤,我们用一个额外的给定映射 M ^ \hat{M} M^覆盖注意力图 M,但保留来自提供的提示的值 V。还用 M t ∗ M^*_t Mt∗表示使用编辑提示 p ∗ p^* p∗生成的注意图。最后,我们将 Edit( M
LuH11241 年前
aigc·图像编辑·文生图大模型
【论文阅读笔记】Emu Edit: Precise Image Editing via Recognition and Generation Tasks基于指令的图像编辑需求很大,但是在编辑准确性上还受限。提出了一种多任务图像编辑模型Emu Edit,将多种任务(基于区域的编辑、自由形式的编辑和计算机视觉任务)表述为生成任务,并学习任务嵌入(有点类似unicontrolnet指示不同任务的编码)以指导生成过程走向正确的编辑类型。