Midjourney V6迎来大升级:网友惊呼生成效果太逼真

和 DALL-E 3 等图像生成模型相比,谁的效果会更好呢?

你真的会被 Midjourney V6 alpha 版本测试的生成效果震撼到。

输入提示:「电影镜头,一个 50 岁留着灰胡子、穿着棕色夹克、戴着红色围巾的黑人男子站在一个 20 岁左右的白人女子旁边,她穿着深蓝和乳白色千鸟格外套,戴着黑色针织帽。午夜,他们走在街道中央,被路灯柔和的橙色光芒照亮。」

图源:twitter.com/nickfloats/...

相比于新版本,v 5.2 的生成效果肉眼可见的差距,人物脸部细节刻画的不是很细致,衣服纹理、褶皱表现的很少:

Midjourney V6 生成雨中的马斯克:

图源:twitter.com/jack24dd30/...

大笑的马斯克:

图源:twitter.com/dogeofficia...

和你对视的女孩:

Midjourney V6 生成的美食,看起来和真的没什么两样,就连薯条有点焦糊的边边都很逼真:

图源:twitter.com/Pinsky/stat...

好莱坞影片级别的汽车追逐场景,尘土飞扬、光影效果非常逼真(不过汽车前轮看起来有点缺陷):

图源:twitter.com/HBCoop\\_/s...

复古的未来主义字母呈现:

图源:twitter.com/AIandDesign...

雨后的街道:

图源:twitter.com/Malzahran2/...

生成的狗狗的每一根毛发都真实再现:

图源:twitter.com/EZE3D/statu...

一脸无辜的看着你的小猫咪:

图源:twitter.com/dnaijatechg...

疯狂动物城的朱迪?

猫头鹰穿衣服:

图源:twitter.com/ciguleva/st...

两只在绳子上的小蜗牛:

图源:twitter.com/OneMeatball...

很多人都被 Midjourney V6 的生成效果震撼到了。

新版本允许输入更长的提示,生成更丰富的细节,甚至可以向照片添加文本。与先前版本一样,新版可通过 Discord 获得。用户需要在 Midjourney Discord 服务器或 Midjourney bot 中键入「/settings」,然后使用顶部的下拉菜单选择 V6。用户也可以使用传统的方法,在提示之后手动输入「-v 6」。

「这个模型可以生成比我们之前发布的任何模型都更加真实的图像,」Midjourney 创始人 David Holz 在 Midjourney Discord 服务器上发布的一条消息中写道,该服务器拥有超过 1700 万会员。Holz 表示,V6 实际上是「在我们的人工智能超级集群上从头开始训练的第三个模型」,花了九个月的时间开发。

设计师 Tatiana Tsiguleva 表示,Midjourney v6 对提示的理解将更加精准,这也意味着不再需要那些奇怪的短语或单词。比如,你想要生成的结果更加真实,你可以以「---style raw」结束提示,而不是输入一些描述性的单词。

不过,目前 V6 缺少 V5.2 上的一些功能,包括左右平移和缩小,但 Holz 表示这些功能将在 V6 的后续更新中提供。

参考链接:venturebeat.com/ai/midjourn...

相关推荐
冬奇Lab11 小时前
Workflow 系列(06):安全——跨步骤注入传播与四层防御
人工智能·工作流引擎
冬奇Lab11 小时前
每日一个开源项目(第149篇):RAG-Anything - 把图片、表格、公式当成一等公民的多模态 RAG 框架
人工智能·开源
米小虾12 小时前
AI Agent 安全实战指南:当智能体开始"不听话",开发者该如何应对?
人工智能·安全·agent
米小虾12 小时前
联合国发布首份全球AI评估报告:我们正站在AI治理的十字路口
aigc·ai编程
IT_陈寒13 小时前
Vite的热更新突然不香了,排查三小时差点砸键盘
前端·人工智能·后端
阿里云大数据AI技术15 小时前
构建高转化海外电商搜索:阿里云OpenSearch行业算法版的全链路智能优化策略实战
人工智能·搜索引擎
Awu122715 小时前
⚡从零开发 Agent CLI(五)实现一个可治理、可扩展的工具系统
前端·人工智能·claude
字节跳动视频云技术团队15 小时前
让 Agent 成为音视频工作台:AI MediaKit CLI + Skill 发布
人工智能·音视频开发
魏祖潇16 小时前
framework 整合实战——DDD/TDD/SDD 三件套在 framework 仓的真实落地
人工智能·后端