战胜DALL·E 3和 Midjourney的开源模型来了——playground-v2.5

这是首次超越闭源AI模型的开源时刻。Playground AI 前不久宣布Playground v2.5正式开源。Playground v2.5 是美学质量方面最先进的开源模型,特别关注增强的颜色和对比度、改进的多纵横比生成以及改进的以人为中心的精细细节。并且在美学质量方面树立了新标准,超越了 SDXL 和 PIXART-α 等领先的开源模型,以及其前身 Playground v2。Playground v2.5 和 SDXL 之间的巨大性能差距促使人们进一步比较了 DALL-E 3 和 Midjourney 5.2 等顶级闭源模型。令人印象深刻的是,Playground v2.5 始终超越这些竞争对手,再次证明了其在生成视觉震撼图像方面的优势。

Playground v2.5 功能

颜色和对比度增强

Playground v2.5 使用 EDM 框架,改进了噪点调度,以实现鲜艳的色彩和深对比度。

这使得产生更逼真和令人印象深刻的图像成为可能。

改进了多种纵横比的生成

改善人员代表性

面部细节、眼睛形状、头发纹理和整体照明等表示在生成人体图像时尤为重要。

在 Playground v2.5 中,开发了一种新的对齐方法,其灵感来自 Emu,在这些以人为本的类别中表现良好。

最后

附上一张 RTX2070 vram 8G 运行的截图

参考

https://marketing-cdn.playground.com/research/pgv2.5_compressed.pdf

https://playground.com/blog/playground-v2-5

相关推荐
sp_fyf_20241 小时前
[大语言模型-论文精读] 更大且更可指导的语言模型变得不那么可靠
人工智能·深度学习·神经网络·搜索引擎·语言模型·自然语言处理
肖遥Janic1 小时前
Stable Diffusion绘画 | 插件-Deforum:商业LOGO广告视频
人工智能·ai·ai作画·stable diffusion
我就是全世界3 小时前
一起了解AI的发展历程和AGI的未来展望
人工智能·agi
colorknight3 小时前
1.2.3 HuggingFists安装说明-MacOS安装
人工智能·低代码·macos·huggingface·数据科学·ai agent
kuan_li_lyg3 小时前
MATLAB - 机械臂手眼标定(眼在手内) - 估计安装在机器人上的移动相机的姿态
开发语言·人工智能·matlab·机器人·ros·机械臂·手眼标定
山川而川-R3 小时前
Windows安装ollama和AnythingLLM
人工智能·python·语言模型·自然语言处理
Kuekua-seu3 小时前
diffusion vs GAN
人工智能·神经网络·生成对抗网络
电子科技圈4 小时前
IAR全面支持国科环宇AS32X系列RISC-V车规MCU
人工智能·嵌入式硬件·mcu·编辑器
大地之灯4 小时前
深度学习每周学习总结J1(ResNet-50算法实战与解析 - 鸟类识别)
人工智能·python·深度学习·学习·算法
OCR_wintone4214 小时前
翔云 OCR:发票识别与验真
人工智能·深度学习·ocr