AIGC:text2img - 文生图

当前手头上的定制化项目,可用训练数据较少,训练的模型效果不佳。所以通过 clip-interrogator 获取图片获取描述后,批量进行 文生图 以增加样本量。

在批量生成前,先简单评测一下当前的主流 文生图 模型。直接上效果:

MidJourney:

https://huggingface.co/spaces/mukaist/Midjourney

优点:基本上能完美复制参考图的场景设定

缺点:多人时,人脸有崩的问题, 不支持中文;闭源&付费

Stable Diffusion 3 Medium:

https://huggingface.co/spaces/stabilityai/stable-diffusion-3-medium

优点:开源&免费

缺点:多人时,人脸崩的非常明显,场景理解上也相对差一点,不支持中文

Kolors:

https://huggingface.co/spaces/Kwai-Kolors/Kolors

优点:开源&免费,支持中文

缺点:中文不稳定,人脸偶尔也会甭,速度慢

FLUX.1 [schnell]:

https://huggingface.co/spaces/black-forest-labs/FLUX.1-schnell

优点:开源&免费,速度快,整体效果上是最好的

缺点:不支持中文,显存占用大

相关推荐
Memene摸鱼日报21 分钟前
「Memene 摸鱼日报 2025.9.16」OpenAI 推出 GPT-5-Codex 编程模型,xAI 发布 Grok 4 Fast
人工智能·aigc
安思派Anspire32 分钟前
创建完整的评估生命周期以构建高(一)
aigc·openai·agent
德育处主任34 分钟前
玩转 Strands:AI Agent 开发,原来可以这么简单!
后端·aigc
Mintopia1 小时前
实时语音转写 + AIGC:Web 端智能交互的技术链路
前端·javascript·aigc
墨风如雪13 小时前
告别臃肿与慢速:小米ZipVoice如何重塑语音合成?
aigc
尘叶心简16 小时前
LangGraphAgent开发实战(二)
aigc·aiops
AI炼金师19 小时前
Claude Code vs Codex
aigc·ai编程
xiaohezi21 小时前
大模型效果总不好?别再靠“玄学”炼丹了!
aigc
安思派Anspire1 天前
从 ETL 到 ELT 再到 EAI:AI 如何重塑数据处理
aigc·openai·agent