AIGC:text2img - 文生图

当前手头上的定制化项目,可用训练数据较少,训练的模型效果不佳。所以通过 clip-interrogator 获取图片获取描述后,批量进行 文生图 以增加样本量。

在批量生成前,先简单评测一下当前的主流 文生图 模型。直接上效果:

MidJourney:

https://huggingface.co/spaces/mukaist/Midjourney

优点:基本上能完美复制参考图的场景设定

缺点:多人时,人脸有崩的问题, 不支持中文;闭源&付费

Stable Diffusion 3 Medium:

https://huggingface.co/spaces/stabilityai/stable-diffusion-3-medium

优点:开源&免费

缺点:多人时,人脸崩的非常明显,场景理解上也相对差一点,不支持中文

Kolors:

https://huggingface.co/spaces/Kwai-Kolors/Kolors

优点:开源&免费,支持中文

缺点:中文不稳定,人脸偶尔也会甭,速度慢

FLUX.1 [schnell]:

https://huggingface.co/spaces/black-forest-labs/FLUX.1-schnell

优点:开源&免费,速度快,整体效果上是最好的

缺点:不支持中文,显存占用大

相关推荐
mCell8 小时前
HTML:AI 时代的通用表达层
前端·html·aigc
SharpCJ16 小时前
当 AI 开始写代码,谁来保证它不会翻车?
aigc·agent·harness
AiTop10020 小时前
Claude Code 推出 Agent View:命令行编程正式进入“多线程并发“时代
开发语言·人工智能·ai·aigc
kuntli20 小时前
周末旅行规划思维树实例
aigc
用户51914958484521 小时前
Camaleon CMS 认证本地文件包含 (LFI) 漏洞利用工具
人工智能·aigc
DigitalOcean1 天前
AI 推理产品省钱指南:如何通过基建优化降低 80% 推理成本?
aigc·agent·vibecoding
OneThingAI1 天前
网心技术 | DeepSeek-V4 核心技术深度解析
aigc·deepseek·onethingai
七牛开发者1 天前
LLM 训练提速约 25% 背后:缓存、重叠与 MoE 路由优化
aigc
imbackneverdie1 天前
2026硕博科研绘图全流程操作指南
人工智能·科技·考研·aigc·科研·科研绘图·ai工具
captain_AIouo1 天前
Captain AI打造OZON全员协同智能工具
大数据·人工智能·经验分享·aigc