战胜DALL·E 3和 Midjourney的开源模型来了——playground-v2.5

这是首次超越闭源AI模型的开源时刻。Playground AI 前不久宣布Playground v2.5正式开源。Playground v2.5 是美学质量方面最先进的开源模型,特别关注增强的颜色和对比度、改进的多纵横比生成以及改进的以人为中心的精细细节。并且在美学质量方面树立了新标准,超越了 SDXL 和 PIXART-α 等领先的开源模型,以及其前身 Playground v2。Playground v2.5 和 SDXL 之间的巨大性能差距促使人们进一步比较了 DALL-E 3 和 Midjourney 5.2 等顶级闭源模型。令人印象深刻的是,Playground v2.5 始终超越这些竞争对手,再次证明了其在生成视觉震撼图像方面的优势。

Playground v2.5 功能

颜色和对比度增强

Playground v2.5 使用 EDM 框架,改进了噪点调度,以实现鲜艳的色彩和深对比度。

这使得产生更逼真和令人印象深刻的图像成为可能。

改进了多种纵横比的生成

改善人员代表性

面部细节、眼睛形状、头发纹理和整体照明等表示在生成人体图像时尤为重要。

在 Playground v2.5 中,开发了一种新的对齐方法,其灵感来自 Emu,在这些以人为本的类别中表现良好。

最后

附上一张 RTX2070 vram 8G 运行的截图

参考

https://marketing-cdn.playground.com/research/pgv2.5_compressed.pdf

https://playground.com/blog/playground-v2-5

相关推荐
BIYing_Aurora16 分钟前
【IPMV】图像处理与机器视觉:Lec10 Edges and Lines
图像处理·人工智能·经验分享·线性代数·计算机视觉·视觉检测
通义灵码24 分钟前
如何使用AI辅助开发R语言
ide·人工智能·vscode·通义灵码
Tech Synapse42 分钟前
端到端自动驾驶系统实战指南:从Comma.ai架构到PyTorch部署
人工智能·pytorch·自动驾驶·carla·end-to-end
珂朵莉MM1 小时前
2023 睿抗机器人开发者大赛CAIP-编程技能赛-本科组(国赛) 解题报告 | 珂学家
人工智能·算法·职场和发展·深度优先·图论
闭月之泪舞1 小时前
OpenCv高阶(十五)——EigenFace人脸识别
人工智能·opencv·计算机视觉
追光天使1 小时前
如何利用 Conda 安装 Pytorch 教程 ?
人工智能·pytorch·conda
鸭鸭鸭进京赶烤1 小时前
第九届电子信息技术与计算机工程国际学术会议(EITCE 2025)
人工智能·计算机视觉·ai·云计算·aigc·mybatis·制造
LabVIEW开发1 小时前
LabVIEW下AI开发
人工智能·labview
视觉&物联智能1 小时前
【杂谈】-智领安全新篇:人工智能驱动现代物理安全防护体系
人工智能·深度学习·安全·aigc·agi
IT古董1 小时前
【漫话机器学习系列】265.普拉托变换的相关问题(Issues With Platt Scaling)
人工智能·机器学习·issue