AIGC:text2img - 文生图

当前手头上的定制化项目,可用训练数据较少,训练的模型效果不佳。所以通过 clip-interrogator 获取图片获取描述后,批量进行 文生图 以增加样本量。

在批量生成前,先简单评测一下当前的主流 文生图 模型。直接上效果:

MidJourney:

https://huggingface.co/spaces/mukaist/Midjourney

优点:基本上能完美复制参考图的场景设定

缺点:多人时,人脸有崩的问题, 不支持中文;闭源&付费

Stable Diffusion 3 Medium:

https://huggingface.co/spaces/stabilityai/stable-diffusion-3-medium

优点:开源&免费

缺点:多人时,人脸崩的非常明显,场景理解上也相对差一点,不支持中文

Kolors:

https://huggingface.co/spaces/Kwai-Kolors/Kolors

优点:开源&免费,支持中文

缺点:中文不稳定,人脸偶尔也会甭,速度慢

FLUX.1 [schnell]:

https://huggingface.co/spaces/black-forest-labs/FLUX.1-schnell

优点:开源&免费,速度快,整体效果上是最好的

缺点:不支持中文,显存占用大

相关推荐
daguanren2 小时前
LMRing 实测榜:GPT-5.4 登顶?Claude 4.6 还能打吗?
github·aigc
trashwbin3 小时前
Agent 帮不了你,不是因为它不够聪明
aigc
树獭叔叔3 小时前
内存价格被Google打下来了?: TurboQuant对KVCache的量化
算法·aigc·openai
qq_454245033 小时前
时空尺度与物理公式的统一:从固体与流体的互变到跨尺度换算
aigc
code小生5 小时前
OpenClaw 多智能体配置不同的文生图模型
aigc
DO_Community5 小时前
如何使用DigitalOcean Gradient 平台上的无服务器推理
人工智能·aigc·ai编程·ai推理
大灰狼来喽7 小时前
OpenClaw 自动化工作流实战:用 Hooks + 定时任务 + Multi-MCP 构建“数字员工“
大数据·运维·人工智能·自动化·aigc·ai编程
NikoAI编程7 小时前
从 Claude Code 到 Agent 工程:两篇万字长文里的架构共识
aigc·ai编程·claude
sin°θ_陈7 小时前
前馈式3D Gaussian Splatting 研究地图(路线一):像素对齐高斯的起点——pixelSplat 与 latentSplat 在解决什么
python·深度学习·3d·aigc·webgl·3dgs·空间智能
AI_Ming7 小时前
程序员转行学习 AI 大模型: 第一次如何调用大模型API | 附完整可运行代码
aigc·openai·ai编程