SD3大模型全面开源!和Midjourney比谁更强?出图效果实测

前言

众所期待的SD3,终于在本月12号全面开源了。目前comfyUI已经可以直接用SD3模型了,而webUI暂时还不支持,估计还需要再一两周吧。但LIbLibAI已经推出了在线webUI使用SD3的功能了。本文就来实测一下,SD3和Midjourney的V6,哪个模型的表现更好。

视频版

3个对比角度

我以"文字渲染"、"语义理解"、"视觉美学"作为3个测试对比的角度。这三个切入点,也是SD3官方推的明星卖点。

文字渲染能力

测试案例:烤盘上的饼干,字母形状,上面摆出了"Fresh"字样,在面包店拍摄,人工照明。

左边是SD3的结果图,右边是MidjourneyV6的结果图。文字的还原率差不多,基本都在1/4-1/2之间。同样都是只支持英文,汉字不支持。这也很好理解,连简单的字母都整不明白,复杂的汉字难度就更高了,短期之内,肯定是没办法支持的。

另外,从画面质感的角度上来说,两者都还不错,我个人觉得,Midjourney的V6,相对来说稍微好一些。

语义识别能力

第二个案例:

三件古董龙玻璃魔法药水,一家废弃旧药店里:

第一件是蓝色的,带有"1.5"标签,

第二件是红色,带有"SDXL"标签,

第三件是绿色,带有"SD3"标签。

左边是SD3的产出结果,右边是Midjourney的产出结果。从色彩的还原度上来说,SD3会更加准确和稳定。画面整体也更加清晰,"指哪打哪"。而Midjourney相对来说,随机性会更大一些。但是画面质感还是Midjourney更胜一筹。

视觉美学能力

第三个案例:3只穿着外套的狗。

SD3的结果,其实看着还可以,画面比较写实,色彩也比较鲜亮,但是和Midjourney一比,还是逊色不少的。毕竟论画面质感和整体审美,Midjourney优势还是非常明显的。会比SD3成熟很多。

总结

从文字渲染、语义理解、视觉美学这三个角度来进行测评。文字渲染上,两者差不多。语义理解,SD3略好一点。视觉审美,Midjourney明显更好。

整体来说,SD3并没有想象中那么惊艳。但毕竟是完全开源免费的产品,给AI创作者们提供了一个非常宽松的社区氛围,已经足够优秀了。

但由于AIGC刚刚爆火,网上相关内容的文章博客五花八门、良莠不齐。要么杂乱、零散、碎片化,看着看着就衔接不上了,要么内容质量太浅,学不到干货。

这里分享给大家一份Adobe大神整理的《AIGC全家桶学习笔记》,相信大家会对AIGC有着更深入、更系统的理解。

有需要的朋友,可以点击下方免费领取!

AIGC所有方向的学习路线思维导图

这里为大家提供了总的路线图。它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。如果下面这个学习路线能帮助大家将AI利用到自身工作上去,那么我的使命也就完成了:

AIGC工具库

AIGC工具库是一个利用人工智能技术来生成应用程序的代码和内容的工具集合,通过使用AIGC工具库,能更加快速,准确的辅助我们学习AIGC

有需要的朋友,可以点击下方卡片免费领取!

精品AIGC学习书籍手册

书籍阅读永不过时,阅读AIGC经典书籍可以帮助读者提高技术水平,开拓视野,掌握核心技术,提高解决问题的能力,同时也可以借鉴他人的经验,结合自身案例融会贯通。

AI绘画视频合集

我们在学习的时候,往往书籍源码难以理解,阅读困难,这时候视频教程教程是就很适合了,生动形象加上案例实战,科学有趣才能更方便的学习下去。


相关推荐
兴趣使然黄小黄3 小时前
【AI-agent】LangChain开发智能体工具流程
人工智能·microsoft·langchain
出门吃三碗饭3 小时前
Transformer前世今生——使用pytorch实现多头注意力(八)
人工智能·深度学习·transformer
l1t3 小时前
利用DeepSeek改写SQLite版本的二进制位数独求解SQL
数据库·人工智能·sql·sqlite
说私域3 小时前
开源AI智能名片链动2+1模式S2B2C商城小程序FAQ设计及其意义探究
人工智能·小程序
开利网络4 小时前
合规底线:健康产品营销的红线与避坑指南
大数据·前端·人工智能·云计算·1024程序员节
非著名架构师4 小时前
量化“天气风险”:金融与保险机构如何利用气候大数据实现精准定价与投资决策
大数据·人工智能·新能源风光提高精度·疾风气象大模型4.0
熙梦数字化5 小时前
2025汽车零部件行业数字化转型落地方案
大数据·人工智能·汽车
刘海东刘海东5 小时前
逻辑方程结构图语言的机器实现(草稿)
人工智能
亮剑20185 小时前
第2节:程序逻辑与控制流——让程序“思考”
开发语言·c++·人工智能
hixiong1235 小时前
C# OpenCVSharp使用 读光-票证检测矫正模型
人工智能·opencv·c#