AIGC:text2img - 文生图

当前手头上的定制化项目,可用训练数据较少,训练的模型效果不佳。所以通过 clip-interrogator 获取图片获取描述后,批量进行 文生图 以增加样本量。

在批量生成前,先简单评测一下当前的主流 文生图 模型。直接上效果:

MidJourney:

https://huggingface.co/spaces/mukaist/Midjourney

优点:基本上能完美复制参考图的场景设定

缺点:多人时,人脸有崩的问题, 不支持中文;闭源&付费

Stable Diffusion 3 Medium:

https://huggingface.co/spaces/stabilityai/stable-diffusion-3-medium

优点:开源&免费

缺点:多人时,人脸崩的非常明显,场景理解上也相对差一点,不支持中文

Kolors:

https://huggingface.co/spaces/Kwai-Kolors/Kolors

优点:开源&免费,支持中文

缺点:中文不稳定,人脸偶尔也会甭,速度慢

FLUX.1 [schnell]:

https://huggingface.co/spaces/black-forest-labs/FLUX.1-schnell

优点:开源&免费,速度快,整体效果上是最好的

缺点:不支持中文,显存占用大

相关推荐
win4r10 小时前
🚀OpenClaw高级使用经验分享!2026年最强生产力!五分钟打造多Agent协作编程开发团队!模型容灾机制深度配置+云端Gateway操控本地macOS!
aigc·openai·ai编程
墨风如雪11 小时前
别再等Sora了,字节Seedance 2.0才是AI视频的“导演时刻”
aigc
chaser&upper11 小时前
AIGC 的“核”动力:深入解读 CANN ops-nn 算子仓库与异构计算之美
aigc
后端小肥肠12 小时前
别再盲目抽卡了!Seedance 2.0 成本太高?教你用 Claude Code 100% 出片
人工智能·aigc·agent
阿杰学AI13 小时前
AI核心知识91——大语言模型之 Transformer 架构(简洁且通俗易懂版)
人工智能·深度学习·ai·语言模型·自然语言处理·aigc·transformer
用户51914958484514 小时前
CVE-2025-47812:Wing FTP Server 高危RCE漏洞分析与利用
人工智能·aigc
SmartBrain15 小时前
战略洞察:以AI为代表的第四次工业革命
人工智能·语言模型·aigc
熬夜敲代码的小N15 小时前
基于CANN生态与OPS-NN仓库:AIGC模型高效部署与核心解析
aigc
纯爱掌门人15 小时前
终焉轮回里,藏着 AI 与人类的答案
前端·人工智能·aigc