Midjourney角色一致功能解读

在无数AI绘画创作者的胡呼声中,Midjourney终于推出了"角色一致性"功能,该功能可在新图像中一致地重新创建角色。AI绘画中的主要障碍终被打破。

这是因为大多数AI图像生成器都依赖于"扩散模型",这些工具类似于或基于Stability AI的Stable Diffusion开源图像生成算法,该算法的工作原理大致是获取用户输入的文本并尝试逐像素拼凑图像。-与该描述相匹配的像素,是从数百万张人类创建的图像的大量(且有争议的)训练数据集中的类似图像和文本标签中学习到的。

添加图片注释,不超过 140 字(可选)

角色一致性对于AI绘画的意义

与基于文本的大型语言模型(LLM)(例如OpenAI的ChatGPT或Cohere的新Command-R)的情况一样,所有生成式AI应用程序的问题在于其响应不一致:AI会为每个提示生成新的内容即使提示重复或使用一些相同的关键字,也应输入该内容。

在Midjourney 的例子中,就是图像。但是,如果你想为电影、小说或漫画制作故事时,你希望相同的一个或多个角色在其中移动并出现在不同的场景中,并具有不同的面部表情和表情,这在Midjourney 以往的版本中是无法实现的。

这种确切的场景对于叙事的连续性通常是必要的,但到目前为止,使用生成式人工智能很难实现。但Midjourney现在正在尝试解决这个问题,引入了一个新标签"-cref"("角色参考"的缩写),用户可以将其添加到Midjourney Discord中文本提示的末尾,并尝试匹配角色的面部表情用户粘贴到所述标签后的URL中的特征、体型,甚至服装。

随着功能的进步和完善,Midjourney可能会进一步从一个很酷的玩具或创意来源变成一个更专业的生产力工具!

Midjourney角色一致性功能使用攻略

该标签最适合与之前生成的Midjourney 图像配合使用。例如,用户的工作流程将首先生成或检索先前生成的角色的URL。

让我们从头开始,假设我们正在生成一个带有以下提示的新角色:"一个肌肉发达的秃头男人,留着胡子,戴着眼罩。"

添加图片注释,不超过 140 字(可选)

我们先将最骂你的那张图像放大,然后在Midjourney Discord服务器中按住Control键单击它以找到"复制链接"选项。

添加图片注释,不超过 140 字(可选)

然后,我们可以在"穿着白色燕尾服站在别墅中--cref[URL]"中输入新的提示,并粘贴我们刚刚生成的图像的URL,Midjourney将尝试在我们的新内容中生成与之前相同的角色。键入的设置。

添加图片注释,不超过 140 字(可选)

此外,用户可以通过将标签"-cw"后跟数字1到100应用到新提示的末尾(在"--cref[URL]"字符串,就像这样:"--cref[URL]--cw 100。""cw"数字越低,结果图像的方差就越大。"cw"数字越高,方差越大。生成的新图像将严格遵循原始参考图像。

当输入非常低的"cw 8"实际上返回我们想要的:白色燕尾服。尽管现在它已经去掉了我们角色独特的眼罩。

添加图片注释,不超过 140 字(可选)

继续"不同区域"

添加图片注释,不超过 140 字(可选)

​虽然眼罩戴错了眼睛........但与期望已经非常接近了

你还可以使用两个并排的"--cref"标签及其各自的URL将多个字符合并为一个字符。

该功能刚刚于近期已在Midjourney国内版同步上线,喜欢AI绘画的朋友们快去试试吧!

Midjourney国内版http://xhs.midjourney9.com//?channel=101545

移动端可以复制链接在浏览器中打开

相关推荐
算家云4 分钟前
快速识别模型:simple_ocr,部署教程
开发语言·人工智能·python·ocr·数字识别·检测模型·英文符号识别
youcans_36 分钟前
【微软:多模态基础模型】(5)多模态大模型:通过LLM训练
人工智能·计算机视觉·大模型·大语言模型·多模态
飞凌嵌入式39 分钟前
飞凌嵌入式T113-i开发板RISC-V核的实时应用方案
人工智能·嵌入式硬件·嵌入式·risc-v·飞凌嵌入式
sinovoip41 分钟前
Banana Pi BPI-CanMV-K230D-Zero 采用嘉楠科技 K230D RISC-V芯片设计
人工智能·科技·物联网·开源·risc-v
搏博1 小时前
神经网络问题之一:梯度消失(Vanishing Gradient)
人工智能·机器学习
z千鑫1 小时前
【人工智能】深入理解PyTorch:从0开始完整教程!全文注解
人工智能·pytorch·python·gpt·深度学习·ai编程
YRr YRr1 小时前
深度学习:神经网络的搭建
人工智能·深度学习·神经网络
威桑1 小时前
CMake + mingw + opencv
人工智能·opencv·计算机视觉
爱喝热水的呀哈喽1 小时前
torch张量与函数表达式写法
人工智能·pytorch·深度学习