战胜DALL·E 3和 Midjourney的开源模型来了——playground-v2.5

这是首次超越闭源AI模型的开源时刻。Playground AI 前不久宣布Playground v2.5正式开源。Playground v2.5 是美学质量方面最先进的开源模型,特别关注增强的颜色和对比度、改进的多纵横比生成以及改进的以人为中心的精细细节。并且在美学质量方面树立了新标准,超越了 SDXL 和 PIXART-α 等领先的开源模型,以及其前身 Playground v2。Playground v2.5 和 SDXL 之间的巨大性能差距促使人们进一步比较了 DALL-E 3 和 Midjourney 5.2 等顶级闭源模型。令人印象深刻的是,Playground v2.5 始终超越这些竞争对手,再次证明了其在生成视觉震撼图像方面的优势。

Playground v2.5 功能

颜色和对比度增强

Playground v2.5 使用 EDM 框架,改进了噪点调度,以实现鲜艳的色彩和深对比度。

这使得产生更逼真和令人印象深刻的图像成为可能。

改进了多种纵横比的生成

改善人员代表性

面部细节、眼睛形状、头发纹理和整体照明等表示在生成人体图像时尤为重要。

在 Playground v2.5 中,开发了一种新的对齐方法,其灵感来自 Emu,在这些以人为本的类别中表现良好。

最后

附上一张 RTX2070 vram 8G 运行的截图

参考

https://marketing-cdn.playground.com/research/pgv2.5_compressed.pdf

https://playground.com/blog/playground-v2-5

相关推荐
arron88997 分钟前
YOLOv8n-pose 模型使用
人工智能·深度学习·yolo
AI人工智能+1 小时前
一种融合AI与OCR的施工许可证识别技术,提升工程监管效率,实现自动化、精准化处理。
人工智能·自动化·ocr·施工许可证识别
大力水手(Popeye)2 小时前
Pytorch——tensor
人工智能·pytorch·python
ygy.白茶3 小时前
从电影分类到鸢尾花识别
人工智能
AI_gurubar6 小时前
大模型教机器人叠衣服:2025年”语言理解+多模态融合“的智能新篇
人工智能·机器人
XINVRY-FPGA8 小时前
EPM240T100I5N Altera FPGA MAX II CPLD
人工智能·嵌入式硬件·fpga开发·硬件工程·dsp开发·射频工程·fpga
HuggingFace8 小时前
开源开发者须知:欧盟《人工智能法案》对通用人工智能模型的最新要求
人工智能
程序员X小鹿9 小时前
实测阿里开源图像编辑模型Qwen-Image-Edit,汉字也能无痕修改!1秒救废图!(附实测案例)
aigc
媒体人8889 小时前
GEO 优化专家孟庆涛:技术破壁者重构 AI 时代搜索逻辑
大数据·人工智能
墨风如雪10 小时前
硬核拆解DeepSeek V3.1:当6850亿参数学会“分身术”
aigc