AIGC:text2img - 文生图

当前手头上的定制化项目,可用训练数据较少,训练的模型效果不佳。所以通过 clip-interrogator 获取图片获取描述后,批量进行 文生图 以增加样本量。

在批量生成前,先简单评测一下当前的主流 文生图 模型。直接上效果:

MidJourney:

https://huggingface.co/spaces/mukaist/Midjourney

优点:基本上能完美复制参考图的场景设定

缺点:多人时,人脸有崩的问题, 不支持中文;闭源&付费

Stable Diffusion 3 Medium:

https://huggingface.co/spaces/stabilityai/stable-diffusion-3-medium

优点:开源&免费

缺点:多人时,人脸崩的非常明显,场景理解上也相对差一点,不支持中文

Kolors:

https://huggingface.co/spaces/Kwai-Kolors/Kolors

优点:开源&免费,支持中文

缺点:中文不稳定,人脸偶尔也会甭,速度慢

FLUX.1 [schnell]:

https://huggingface.co/spaces/black-forest-labs/FLUX.1-schnell

优点:开源&免费,速度快,整体效果上是最好的

缺点:不支持中文,显存占用大

相关推荐
后端小肥肠2 小时前
10W+育儿漫画是怎么做的?我用n8n搭建了自动化工作流,3分钟生成到本地磁盘
人工智能·aigc·agent
司马阅-SmartRead3 小时前
司马阅与铨亿科技达成生态战略合作,AI赋能工业领域智能化转型
人工智能·aigc
Mintopia8 小时前
🤖 通用人工智能(AGI)离 Web 应用还有多远?
前端·javascript·aigc
墨风如雪18 小时前
360 FG-CLIP2:让AI拥有“火眼金睛”,刷新全球图文理解上限
aigc
用户5191495848451 天前
原型污染攻击工具揭秘:Prototype Pollution Gadgets Finder
人工智能·aigc
安思派Anspire1 天前
构建一个自主深度思考的RAG管道以解决复杂查询--通过网络搜索扩充知识(6)
aigc·openai·agent
ZEGO即构开发者1 天前
【ZEGO即构开发者日报】Soul AI Lab开源播客语音合成模型;腾讯混元推出国内首个交互式AI播客;ChatGPT Go向用户免费开放一年......
人工智能·aigc·语音识别·实时音视频
Baihai_IDP1 天前
怎样为你的 RAG 应用选择合适的嵌入模型?
人工智能·llm·aigc
视觉&物联智能1 天前
【杂谈】-制造业变革:机器人与自动化引领新时代
人工智能·ai·机器人·自动化·aigc·agi·deepseek
Mintopia1 天前
🧬 医疗Web场景下,AIGC的辅助诊断技术边界与伦理
前端·javascript·aigc