Stable Diffusion V3测评

1.引言

3月5号,Stability AI发布了介绍Stable Diffusion V3的研究论文,链接地址:戳我

这是目前他们发布的最先进、功能最强大的图像生成器,与一年多前发布的令人印象深刻的 Stable Diffusion V2.1 相比有了大幅升级。SD3所带来的新功能如下:支持文本渲染、性能更优、更好的图像生成质量。

外网有博客尝试把SD3 生成的图像与两款最流行、功能最强大的人工智能图像生成器Midjourney V6Dall-E 3 做了比较,这里对测评结果进行了相应的转述。

2.测评一

测试一的文本提示词如下:

Photo of a red sphere on top of a blue cube. Behind them is a green triangle, on the right is a dog, on the left is a cat
一张红色球体位于蓝色立方体之上的照片。后面是一个绿色三角形,右边是一只狗,左边是一只猫

我们先来看下SD3的生成效果:

让人眼前一亮的是猫和狗脖子上的绿色色调。看来 SD3 能够理解环境并模拟光的反射。

相比之下,Midjourney V6Dall-E 3 的图像虽然给人留下了深刻印象,但却在不同方面有所欠缺。二者根据上述提示词所生成的图像分别如下:


对比上述结果,Midjourney V6 奇怪地将动物放在蓝色方块上,而 Dall-E 3 的结果则令人费解,文不对题。在这一轮比赛中,SD3 以实际符合提示要求而获得第一名。

3.测评二

实验二的文本提示词如下所示:

Resting on the kitchen table is an embroidered cloth with the text 'good night' and an embroidered baby tiger. Next to the cloth there is a lit candle. The lighting is dim and dramatic
灶台上放着一块刺绣布,上面写着 "晚安 "和一只刺绣小老虎。布的旁边有一支点燃的蜡烛。灯光昏暗而富有戏剧性

按照惯例,我们先来看下SD3的表现:

这张特写照片非常漂亮。我喜欢它将边缘模糊化,而将重点放在老虎和文字上。刺绣的细节也非常棒。大家几乎可以感觉到针脚的刮擦纹理,以及随着针脚变化所带来的模糊效果。

接下来我们看下竞争对手的效果,依次为MidjourneyDall-E3的效果:

Midjourney 一如所料,采用了标志性的暗色调和精准的灯光。Dall-E 3在这方面也做得很好,尽管他们都增加了一些提示中没有的其他元素。

个人看法,SD3严格遵守了提示词的要求,所以这一轮测评中它是赢家...不过, Midjourney 的艺术诠释也很让人着迷。

4.测评三

实验三的文本提示词如下所示:

Photo of an 90's desktop computer on a work desk, on the computer screen it says "welcome". On the wall in the background we see beautiful graffiti with the text "SD3" very large on the wall.
办公桌上 90 年代台式电脑的照片,电脑屏幕上写着 "欢迎"。背景墙上有美丽的涂鸦,"SD3 "字样非常醒目。

首先,我们先来看下SD3的表现:

巨大的文字与背景融合得天衣无缝。注意字体的一致性。看起来就像是直接从 Photoshop 中生成的插图。

现在,让我们看看 Midjourney Dall-E 3 的表现:


就风格和细节而言,Midjourney很容易入选。但提示要求在墙上写很大的文字,而Midjourney在细节上没有做到这一点。因此,就连贯性而言,SD3 是最佳选择。Dall-E 3 的结果相对逊色不少。

5.总结

从测试图像来看,SD3 显然在文本生成和提示词连贯性方面表现出色,可以说超越了其强大的竞争对手。不过,就图像质量和风格而言,我仍然认为 Midjourney在一些场景下也不容小觑。 但是,与竞争对手不同,Stable Diffusion 一直是开源的,完全免费!这意味着大家很快就能下载 SD3 并在本地免费运行。但这也有一个巨大的弊端,那就是可能会引发严重的社会伦理问题。试想一下,更令人难以区分的深度伪造图像和视频的危害性有多大。

相关推荐
蚝油菜花6 分钟前
这个开源AI平台把文生图/音/字全包了!Pollinations.AI:提供完全免费的AI内容生成
人工智能·开源
补三补四11 分钟前
CNN卷积神经网络
人工智能·深度学习·神经网络·机器学习·cnn
山茶君_nlefer12 分钟前
高德AI MCP + Cursor 旅行规划神器。用它直接生成五一出行旅行计划!【附详细教程+提示词】
人工智能
墨风如雪13 分钟前
AI圈炸锅!OpenAI发布o3和o4-mini:不止聪明,更能“看图思考”和自主干活了?
aigc
AI_Auto13 分钟前
AI Agent系列(九) -Data Agent(数据分析智能体)
人工智能·数据挖掘·数据分析
zozowind14 分钟前
1Panel快速安装Dify指南
人工智能·后端
蚝油菜花14 分钟前
测试工程师要失业?Magnitude:开源AI Agent驱动的端到端测试框架,让Web测试更智能,自动完善测试用例!
人工智能·开源
win4r14 分钟前
🚀OpenAI首发轻量级AI编程智能体-OpenAI Codex CLI,编程能力能否超越cursor?Codex编程智能体实战,打破编程瓶颈,自动化开发
aigc·openai·cursor
卓豪终端管理27 分钟前
如何安全地管理固定功能设备?
java·大数据·开发语言·网络·人工智能·安全
Sherlock Ma33 分钟前
基于LightRAG进行本地RAG部署(包括单卡多卡本地模型部署、调用阿里云或DeepSeekAPI的部署方法、RAG使用方法)
人工智能·阿里云·大模型·aigc·检索增强·rag·deepseek