AIGC:text2img - 文生图

当前手头上的定制化项目,可用训练数据较少,训练的模型效果不佳。所以通过 clip-interrogator 获取图片获取描述后,批量进行 文生图 以增加样本量。

在批量生成前,先简单评测一下当前的主流 文生图 模型。直接上效果:

MidJourney:

https://huggingface.co/spaces/mukaist/Midjourney

优点:基本上能完美复制参考图的场景设定

缺点:多人时,人脸有崩的问题, 不支持中文;闭源&付费

Stable Diffusion 3 Medium:

https://huggingface.co/spaces/stabilityai/stable-diffusion-3-medium

优点:开源&免费

缺点:多人时,人脸崩的非常明显,场景理解上也相对差一点,不支持中文

Kolors:

https://huggingface.co/spaces/Kwai-Kolors/Kolors

优点:开源&免费,支持中文

缺点:中文不稳定,人脸偶尔也会甭,速度慢

FLUX.1 [schnell]:

https://huggingface.co/spaces/black-forest-labs/FLUX.1-schnell

优点:开源&免费,速度快,整体效果上是最好的

缺点:不支持中文,显存占用大

相关推荐
爱吃的小肥羊9 分钟前
我被灰度到了,实测 GPT-imagev2,中文直接封神!
aigc·openai
安思派Anspire1 小时前
内容创作的核心变量:从选题判断到系统化生产的再思考 AI 选题及预测工具 百万加 MPlus
人工智能·aigc
卜闻卜问3 小时前
学习编辑自己的 Skill:如何书写一个合格的 AI 工作流指令
aigc
爱吃的小肥羊4 小时前
一个问题,GPT-6是否值得期待???
aigc·openai
皮尔卡Q5 小时前
二十七、“仿小红书”全栈项目微服务架构改造(二)
aigc
皮尔卡Q5 小时前
二十一、前端技术Vue.js
aigc
刀法如飞7 小时前
MicroWind:AI编程核心知识库,程序员转型必备
人工智能·aigc·ai编程
日光明媚7 小时前
FFmpeg 视频生成推理 Pipeline:Python 版常用函数封装(可直接集成)
python·深度学习·ai作画·aigc·音视频
树獭叔叔8 小时前
OpenCLI:让任何网站成为你的命令行工具
后端·aigc·openai
日光明媚8 小时前
SoulX-FlashTalk 技术报告解读:从“严格因果”到“双向流式蒸馏”,实时数字人为什么能做到 0.87s 延迟、32FPS 和长时稳定?
人工智能·python·深度学习·ai作画·aigc·音视频