Midjourney角色一致功能解读

在无数AI绘画创作者的胡呼声中,Midjourney终于推出了"角色一致性"功能,该功能可在新图像中一致地重新创建角色。AI绘画中的主要障碍终被打破。

这是因为大多数AI图像生成器都依赖于"扩散模型",这些工具类似于或基于Stability AI的Stable Diffusion开源图像生成算法,该算法的工作原理大致是获取用户输入的文本并尝试逐像素拼凑图像。-与该描述相匹配的像素,是从数百万张人类创建的图像的大量(且有争议的)训练数据集中的类似图像和文本标签中学习到的。

添加图片注释,不超过 140 字(可选)

角色一致性对于AI绘画的意义

与基于文本的大型语言模型(LLM)(例如OpenAI的ChatGPT或Cohere的新Command-R)的情况一样,所有生成式AI应用程序的问题在于其响应不一致:AI会为每个提示生成新的内容即使提示重复或使用一些相同的关键字,也应输入该内容。

在Midjourney 的例子中,就是图像。但是,如果你想为电影、小说或漫画制作故事时,你希望相同的一个或多个角色在其中移动并出现在不同的场景中,并具有不同的面部表情和表情,这在Midjourney 以往的版本中是无法实现的。

这种确切的场景对于叙事的连续性通常是必要的,但到目前为止,使用生成式人工智能很难实现。但Midjourney现在正在尝试解决这个问题,引入了一个新标签"-cref"("角色参考"的缩写),用户可以将其添加到Midjourney Discord中文本提示的末尾,并尝试匹配角色的面部表情用户粘贴到所述标签后的URL中的特征、体型,甚至服装。

随着功能的进步和完善,Midjourney可能会进一步从一个很酷的玩具或创意来源变成一个更专业的生产力工具!

Midjourney角色一致性功能使用攻略

该标签最适合与之前生成的Midjourney 图像配合使用。例如,用户的工作流程将首先生成或检索先前生成的角色的URL。

让我们从头开始,假设我们正在生成一个带有以下提示的新角色:"一个肌肉发达的秃头男人,留着胡子,戴着眼罩。"

添加图片注释,不超过 140 字(可选)

我们先将最骂你的那张图像放大,然后在Midjourney Discord服务器中按住Control键单击它以找到"复制链接"选项。

添加图片注释,不超过 140 字(可选)

然后,我们可以在"穿着白色燕尾服站在别墅中--cref[URL]"中输入新的提示,并粘贴我们刚刚生成的图像的URL,Midjourney将尝试在我们的新内容中生成与之前相同的角色。键入的设置。

添加图片注释,不超过 140 字(可选)

此外,用户可以通过将标签"-cw"后跟数字1到100应用到新提示的末尾(在"--cref[URL]"字符串,就像这样:"--cref[URL]--cw 100。""cw"数字越低,结果图像的方差就越大。"cw"数字越高,方差越大。生成的新图像将严格遵循原始参考图像。

当输入非常低的"cw 8"实际上返回我们想要的:白色燕尾服。尽管现在它已经去掉了我们角色独特的眼罩。

添加图片注释,不超过 140 字(可选)

继续"不同区域"

添加图片注释,不超过 140 字(可选)

​虽然眼罩戴错了眼睛........但与期望已经非常接近了

你还可以使用两个并排的"--cref"标签及其各自的URL将多个字符合并为一个字符。

该功能刚刚于近期已在Midjourney国内版同步上线,喜欢AI绘画的朋友们快去试试吧!

Midjourney国内版http://xhs.midjourney9.com//?channel=101545

移动端可以复制链接在浏览器中打开

相关推荐
暗夜猎手-大魔王2 分钟前
转载--AI Agent 架构设计:记忆污染(OpenClaw、Claude Code、Hermes Agent 对比)
人工智能
2zcode3 分钟前
面向健身与康复训练的基于深度学习的人体姿态检测与动作纠正系统
人工智能·深度学习·智能电视
HIT_Weston3 分钟前
66、【Agent】【OpenCode】用户对话提示词(Agent 主动性)
人工智能·agent·opencode
Chengbei114 分钟前
轻量化 Web 安全日志分析神器 星川智盾日志威胁检测、地理溯源、MITRE ATT&CK 映射,支持 Windows/macOS/Linux
前端·人工智能·安全·web安全·macos·系统安全·安全架构
久菜盒子工作室8 分钟前
中国工业气体行业研究报告(2026)
大数据·人工智能
GISer_Jing13 分钟前
AI时代面试新常态——从“会用工具”到“深挖原理”的跨越
前端·人工智能·ai编程
IT_陈寒24 分钟前
React的useEffect把我坑惨了,这些闭包陷阱真要命
前端·人工智能·后端
财经资讯数据_灵砚智能24 分钟前
基于全球经济类多源新闻的NLP情感分析与数据可视化(夜间-次晨)2026年5月1日
大数据·人工智能·python·信息可视化·自然语言处理
Flandern111128 分钟前
# 学习AI Agent中了解到的几个概念
人工智能·学习
2601_9583205729 分钟前
【零基础新手入门 】OpenClaw 2.6.6 对接阿里云百炼配置教程(包含安装包)
人工智能·阿里云·云计算·open claw·小龙虾·open claw安装·open claw一键安装