令人兴奋的 Dall-E3 即将到来

经过10个月左右的沉寂,OpenAI 终于即将要发布 Dall-E3,这是其 AI 图像生成器的最新版本。据说 Dall-E3 比 Dall-E2 有明显的改进升级,具有更多细微差别和细节。

Dall-E3 有什么新功能?

  • 更好的图像质量和一致性
  • Dall-E3 可以生成文本
  • Dall-E3 集成在 ChatGPT 中
  • Dall-E3 创建的图像版权归用户

据说目前的版本可供约 400 个用户使用,超越了 OpenAI 的先前模型以及公认的竞争对手,例如 Midjourney 或者 Stable Diffusion XL。

更好的图像质量和一致性

和 Dall-E2 相比,Dall-E3 有更好的图像质量和一致性。

为了更好地说明其差异,来看看下面的示例。两个图像使用相同的提示(提示还是以英文为主)。

Prompt: A paper craft art depicting a girl giving her cat a gentle hug. Both sit amidst potted plants, with the cat purring contentedly while the girl smiles. The scene is adorned with handcrafted paper flowers and leaves.

这个例子展示了 Dall-E3 理解和生成复杂概念的能力。除此之外,注意到右图中的女孩既没有微笑也没有拥抱猫。

Dall-E3 可以生成文本

另一个重要的更新是能够正确、清晰地拼写单词。例如,可以使用 Dall-E3 生成复古的旅行海报:

Prompt: A vintage travel poster for Venus in portrait orientation. The scene portrays the thick, yellowish clouds of Venus with a silhouette of a vintage rocket ship approaching. Mysterious shapes hint at mountains and valleys below the clouds. The bottom text reads, 'Explore Venus: Beauty Behind the Mist'. The color scheme consists of golds, yellows, and soft oranges, evoking a sense of wonder.

这个实例 AI 根据海报风格选择其理解的字体和颜色以匹配海报的整体美感,这一点是其他人工智能工具无法做到的。

集成在 ChatGPT 中

从 2023 年 10 月开始,ChatGPT Plus 订阅者将能够在 ChatGPT 中本地使用 Dall-E3 。这意味着可以使用 ChatGPT 生成或完善 Dall-E3 的提示,只需询问想查看什么即可。

ChatGPT Plus 还允许访问最新的语言模型、GPT-4 和 ChatGPT 插件,有条件的可以开通尝试。

它将于今年秋天晚些时候在 OpenAI Labs 上推出。

图像版权归用户

使用 Dall-E3 创建的图像可供您使用、重印、出售或商品化。

根据内容政策和条款,您拥有使用 DALL·E 创建的图像,包括转载、销售和商品化的权利 - 无论图像是通过免费还是付费信用生成的。

比 MidJourney 好吗?

MidJourney AI 长期以来被认为是最好的 AI 图像生成器。然而,Dall-E3 生成的图像质量是相当的,这两种工具目前处于激烈的竞争之中。

下面来看一个示例,当然这个示例不能代表所有,每个工具对于不同用户的喜好程度是不一样的。

Prompt: A vibrant yellow banana-shaped couch sits in a cozy living room, its curve cradling a pile of colorful cushions. on the wooden floor, a patterned rug adds a touch of eclectic charm, and a potted plant sits in the corner, reaching towards the sunlight filtering through the window. 提示:舒适的客厅里摆放着一张充满活力的黄色香蕉形沙发,其曲线支撑着一堆色彩缤纷的靠垫。木地板上,有图案的地毯增添了一丝不拘一格的魅力,一盆盆栽坐落在角落里,迎向透过窗户的阳光。

从上面的结果来看,其实跟现实中的两个人类似,不同的理解而已,效果都相当惊人。

总结

Dall-E3 目前尚未公开,但其结果的早期效果令人印象深刻。如果事实证明它比 MidJourney 更好,相信很多人愿意取消MidJourney 订阅并在 ChatGPT 上使用 Dall-E3。

译自:medium.com/generative-...

相关推荐
waynaqua37 分钟前
FastAPI开发AI应用一:实现连续多轮对话
python·openai
waynaqua41 分钟前
FastAPI开发AI应用二:多厂商模型使用指南
python·openai
得帆云低代码18 小时前
什么是AI网关?AI网关如何为企业私有化部署筑防
openai
Georgewu19 小时前
【AI大模型入门指南】机器学习入门详解
aigc·openai
俞乾21 小时前
Context Engineering(上下文工程)是 AI Agent 成功的关键吗?
openai·ai编程
哪吒编程1 天前
写作、编程最强模型Claude Opus 4,碾压o3、Gemini 2.5 Pro,国内直接使用
openai·claude
新智元1 天前
半数清华,8 位华人 AI 天团集体投奔 Meta!奥特曼:砸钱抢人不如培养死忠
人工智能·openai
新智元1 天前
全球顶尖 CS 论文惊爆 AI「好评密令」!哥大等 14 所高校卷入,学术圈炸锅
人工智能·openai
杰尼橙子1 天前
深度解读Karpathy说的Software 3.0时代,感觉是个人的机会很大的时代呀
人工智能·openai
FogLetter1 天前
智能前端之拍照识别单词(下):AI集成与交互优化
前端·aigc·openai