AIGC:text2img - 文生图

当前手头上的定制化项目,可用训练数据较少,训练的模型效果不佳。所以通过 clip-interrogator 获取图片获取描述后,批量进行 文生图 以增加样本量。

在批量生成前,先简单评测一下当前的主流 文生图 模型。直接上效果:

MidJourney:

https://huggingface.co/spaces/mukaist/Midjourney

优点:基本上能完美复制参考图的场景设定

缺点:多人时,人脸有崩的问题, 不支持中文;闭源&付费

Stable Diffusion 3 Medium:

https://huggingface.co/spaces/stabilityai/stable-diffusion-3-medium

优点:开源&免费

缺点:多人时,人脸崩的非常明显,场景理解上也相对差一点,不支持中文

Kolors:

https://huggingface.co/spaces/Kwai-Kolors/Kolors

优点:开源&免费,支持中文

缺点:中文不稳定,人脸偶尔也会甭,速度慢

FLUX.1 [schnell]:

https://huggingface.co/spaces/black-forest-labs/FLUX.1-schnell

优点:开源&免费,速度快,整体效果上是最好的

缺点:不支持中文,显存占用大

相关推荐
AI白艿9 小时前
告别同质化竞争,先知AI赋予男装品牌独特智慧基因
人工智能·aigc
阿杰学AI11 小时前
AI核心知识67——大语言模型之NTP (简洁且通俗易懂版)
人工智能·ai·语言模型·自然语言处理·aigc·ntp·机械学习
下海fallsea12 小时前
安踏为何执着于“买买买”
人工智能·aigc
阿杰学AI14 小时前
AI核心知识68——大语言模型之NSP (简洁且通俗易懂版)
人工智能·ai·语言模型·自然语言处理·aigc·nsp·下一状态预测
badfl1 天前
AI漫剧技术方案拆解:NanoBanana+Sora视频生成全流程
人工智能·ai·ai作画
秋名山大前端1 天前
AI数字孪生本体智能技术方案
人工智能·aigc·数据可视化
视觉&物联智能1 天前
【杂谈】-2026年人工智能发展趋势:智能体崛起、行业洗牌与安全挑战
人工智能·安全·llm·aigc·agi·智能体
AI茶皖1 天前
先知AI如何破解男装行业AIGC应用困局?
aigc
学习3人组1 天前
Nano Banana Gemini 2.5 Flash Image闭源API提供服务
aigc·nano banana