战胜DALL·E 3和 Midjourney的开源模型来了——playground-v2.5

这是首次超越闭源AI模型的开源时刻。Playground AI 前不久宣布Playground v2.5正式开源。Playground v2.5 是美学质量方面最先进的开源模型,特别关注增强的颜色和对比度、改进的多纵横比生成以及改进的以人为中心的精细细节。并且在美学质量方面树立了新标准,超越了 SDXL 和 PIXART-α 等领先的开源模型,以及其前身 Playground v2。Playground v2.5 和 SDXL 之间的巨大性能差距促使人们进一步比较了 DALL-E 3 和 Midjourney 5.2 等顶级闭源模型。令人印象深刻的是,Playground v2.5 始终超越这些竞争对手,再次证明了其在生成视觉震撼图像方面的优势。

Playground v2.5 功能

颜色和对比度增强

Playground v2.5 使用 EDM 框架,改进了噪点调度,以实现鲜艳的色彩和深对比度。

这使得产生更逼真和令人印象深刻的图像成为可能。

改进了多种纵横比的生成

改善人员代表性

面部细节、眼睛形状、头发纹理和整体照明等表示在生成人体图像时尤为重要。

在 Playground v2.5 中,开发了一种新的对齐方法,其灵感来自 Emu,在这些以人为本的类别中表现良好。

最后

附上一张 RTX2070 vram 8G 运行的截图

参考

https://marketing-cdn.playground.com/research/pgv2.5_compressed.pdf

https://playground.com/blog/playground-v2-5

相关推荐
迷你可可小生1 分钟前
常见神经网络模块
人工智能·深度学习
大厂技术总监下海2 分钟前
你的个人AI工作站已就绪:Ollama开源框架,支持多模态、可定制、一键部署
人工智能·机器学习·开源
行业探路者6 分钟前
如何利用二维码提升产品画册的制作与传播?
大数据·人工智能·安全·二维码·设备巡检
安达发公司10 分钟前
安达发|给“工业心脏”装上新大脑:APS生产排产的硬核智慧
大数据·人工智能·aps高级排程·aps排程软件·生产计划排单软件·aps生产排产
chatexcel14 分钟前
ChatExcel一年完成3轮融资,构建全模态数据链路平台,定义 AI for Data
人工智能
Mintopia14 分钟前
🎙️ React Native(RN)语音输入场景全解析
android·react native·aigc
悦数图数据库17 分钟前
“复旦大学—杭州悦数先进金融图技术校企联合研究中心年度总结会”圆满举行
大数据·数据库·人工智能
星浩AI20 分钟前
LCEL:打造可观测、可扩展、可部署的 LangChain 应用
人工智能·后端·python
agicall.com20 分钟前
信创电话助手自动录音功能说明
人工智能·语音识别·自动录音·座机录音·固话录音