ChatGPT Images 2.0 角色一致性实战：如何在多轮对话中保持人物形象统一

**摘要：**文章介绍了在 ChatGPT Images 2.0 多轮图像生成中保持角色一致的方法。核心是不要只写"保持一致"，而要建立完整的角色设定，包括年龄、脸型、发型、眼睛、服装、配饰和标志性特征等视觉锚点。创作时应先生成正面角色基准图或三视图，作为后续参考；每轮生成都要重复关键特征，并明确哪些不可改变、哪些可以变化，如场景、动作和表情。若支持上传图片，应结合参考图和文字提示。为避免角色漂移，应一次只改变少量变量，换服装或画风时尤其要锁定脸部、发型和标志性符号。总体来说，角色一致性依赖稳定设定、参考图、结构化提示词和渐进式修改流程。

在使用 ChatGPT Images / 图像生成模型做漫画、绘本、分镜、IP 角色海报时，最常见的问题之一就是：第一张图很好看，但第二张开始人物就变了。

比如：

发型变了；
脸型变了；
服装细节丢了；
眼睛颜色不一致；
年龄感变化；
同一个角色在不同镜头里像不同人。

要想在多轮对话中保持人物形象统一，关键不是只写一句"保持角色一致"，而是要建立一套角色设定、视觉锚点、参考图、提示词结构和迭代流程。

下面是基于库拉镜像平台（https 传**://ouai** 送**.me/** 门）的 Image 2.0的一套实战方法。

一、先建立"角色圣经"：不要只描述，要锁定视觉锚点

角色一致性的核心是：让模型在每一轮都能抓住同一个人的关键特征。

你需要为角色建立一份固定设定，也可以叫：

角色圣经；
Character Bible；
角色视觉档案；
人物一致性提示词。

示例：角色设定模板

复制代码

角色名称：林夏

年龄：24岁
性别：女性
体型：身高约165cm，身材纤细，肩膀窄，姿态轻盈
脸型：鹅蛋脸，下巴较柔和
肤色：白皙偏暖
发型：深棕色中长发，长度到锁骨，微卷，空气刘海
眼睛：杏仁眼，琥珀色瞳孔，眼神温柔
鼻子：小巧挺直
嘴唇：自然粉色，唇形柔和
标志性特征：左眼下方有一颗很小的泪痣
服装：米白色针织开衫，内搭浅蓝色连衣裙
配饰：细银项链，圆形小耳钉
气质：安静、温柔、略带书卷气
画风：半写实日系插画，柔和光影，干净背景

这个设定越稳定，后续越容易保持一致。

二、给角色设计"不可变特征"和"可变特征"

很多人提示词写得太散，导致模型不知道哪些必须固定，哪些可以变化。

建议把角色拆成两类：

1. 不可变特征

这些是每一轮都必须保留的：

复制代码

必须保持不变：
- 深棕色锁骨长度微卷发
- 空气刘海
- 琥珀色杏仁眼
- 左眼下方小泪痣
- 米白色针织开衫
- 浅蓝色连衣裙
- 细银项链
- 温柔安静的气质

2. 可变特征

这些可以根据画面变化：

复制代码

可以变化：
- 姿势
- 表情
- 镜头角度
- 背景环境
- 光线
- 手部动作
- 画面构图

这样模型会更清楚：人物不变，场景和动作变化。

三、第一张图最重要：先生成"角色基准图"

不要一开始就生成复杂场景。

建议第一步先生成一张干净、正面的角色设定图。

示例提示词

复制代码

请生成一张角色设定图。

角色名称：林夏。
她是一位24岁的年轻女性，身材纤细，鹅蛋脸，白皙偏暖肤色。她有深棕色锁骨长度微卷发，空气刘海，琥珀色杏仁眼，左眼下方有一颗很小的泪痣。她穿着米白色针织开衫，内搭浅蓝色连衣裙，戴细银项链和圆形小耳钉。她的气质安静、温柔、略带书卷气。

画风：半写实日系插画，柔和光影，干净浅色背景。
构图：正面半身像，人物居中，清晰展示脸部、发型、服装和配饰。
要求：不要夸张表情，不要复杂背景，不要改变上述外貌特征。

第一张图的目标不是"好看炸裂"，而是建立角色标准形象。

生成后，如果满意，可以把它作为后续对话中的参考图或视觉基准。

四、多轮生成时，始终引用"这位角色"

当你有了基准图之后，后续不要重新描述成另一个人，而是要明确告诉模型：

继续使用上一张图中的同一位女性角色。

同时补充关键特征。

示例：生成咖啡馆场景

复制代码

请继续使用上一张图中的同一位女性角色林夏，保持她的脸型、发型、发色、琥珀色眼睛、左眼下方的小泪痣、米白色针织开衫、浅蓝色连衣裙和细银项链不变。

这次请画她坐在安静的咖啡馆靠窗位置，双手捧着一杯热咖啡，微微低头微笑。窗外是下雨的街道，室内有温暖的黄色灯光。

画风保持半写实日系插画，柔和光影，色调温暖。
要求：人物必须与上一张图保持一致，只改变场景、姿势和表情。

重点是这句话：

复制代码

只改变场景、姿势和表情，不改变人物身份、脸部特征、发型、服装和配饰。

五、每次都重复关键特征，不要完全依赖上下文

虽然多轮对话有上下文，但图像生成对细节的记忆并不总是稳定。

所以，每次生成都建议重复核心特征。

不要只写：

复制代码

让她去公园。

而是写：

复制代码

继续使用同一位角色林夏：深棕色锁骨长度微卷发、空气刘海、琥珀色杏仁眼、左眼下方小泪痣，穿米白色针织开衫和浅蓝色连衣裙。让她出现在春天的公园里，坐在长椅上读书。

模型每次看到清晰的角色锚点，稳定性会高很多。

六、使用"角色一致性提示词结构"

你可以固定一个提示词结构，每一张图都按这个格式写。

通用结构

复制代码

【角色身份】
继续使用上一张图中的同一位角色：角色名。

【固定外貌】
保持以下特征不变：发型、发色、眼睛、脸型、肤色、标志性特征、服装、配饰、气质。

【当前场景】
这次她在什么地方、做什么动作、有什么表情。

【镜头语言】
半身/全身/特写，正面/侧面/俯视/仰视，近景/中景/远景。

【画风】
保持与前图一致的画风、光影、色彩和质感。

【限制】
不要改变人物年龄、脸型、发型、发色、服装、配饰和标志性特征。

示例

复制代码

【角色身份】
继续使用上一张图中的同一位角色林夏。

【固定外貌】
她是24岁女性，鹅蛋脸，白皙偏暖肤色，深棕色锁骨长度微卷发，空气刘海，琥珀色杏仁眼，左眼下方有一颗小泪痣。她穿米白色针织开衫，内搭浅蓝色连衣裙，戴细银项链和圆形小耳钉。气质安静温柔。

【当前场景】
她站在图书馆书架之间，手里拿着一本打开的书，微微侧头看向镜头，表情温柔。

【镜头语言】
中景，三分之二侧脸，人物居中，背景轻微虚化。

【画风】
半写实日系插画，柔和自然光，干净细腻的笔触。

【限制】
必须保持人物与上一张图一致，只改变场景和姿势，不改变发型、服装、脸部特征和标志性泪痣。

七、用"角色三视图"提升稳定性

如果要做系列内容，建议先生成一张角色三视图：

正面；
侧面；
背面；
可加不同表情。

提示词示例

复制代码

请为角色林夏生成一张角色三视图设定图。

角色保持以下设定：24岁女性，鹅蛋脸，白皙偏暖肤色，深棕色锁骨长度微卷发，空气刘海，琥珀色杏仁眼，左眼下方有一颗小泪痣。穿米白色针织开衫，内搭浅蓝色连衣裙，戴细银项链和圆形小耳钉。

画面包括：
1. 正面站姿
2. 侧面站姿
3. 背面站姿
4. 三个小表情头像：微笑、惊讶、认真

要求：角色在所有视角中保持同一人，发型、服装、体型和气质一致。背景简洁，类似动画角色设定表。

三视图适合用于：

漫画分镜；
游戏角色设定；
绘本角色；
短视频封面系列；
IP 表情包。

八、用"参考图 + 文本锚点"双重约束

如果工具支持上传图片，推荐采用：

上传基准角色图；
在提示词中说明"以这张图为角色参考"；
再重复关键文本特征。

示例

复制代码

请以我上传的图片作为角色外貌参考，继续绘制同一位女性角色林夏。

必须保持：
- 脸型一致
- 发型一致
- 发色一致
- 琥珀色眼睛一致
- 左眼下方小泪痣一致
- 米白色针织开衫和浅蓝色连衣裙一致
- 温柔安静的气质一致

新画面：她在黄昏的海边散步，微风吹动头发，手里拿着一本书。画风、人物比例和面部风格与参考图保持一致。

这样比单纯文字描述稳定得多。

九、避免一次性改变太多变量

角色崩掉的常见原因是：

你同时改变了场景、服装、姿势、镜头角度、画风、年龄、表情。

例如：

复制代码

让她穿战斗服，在赛博朋克城市里奔跑，镜头俯视，强烈霓虹光，写实电影风。

这很容易导致角色变化。

更稳定的方法是逐步变化：

第一步：只换场景

复制代码

保持角色完全一致，只把背景换成夜晚城市街道。

第二步：再换动作

复制代码

保持角色一致，让她在夜晚城市街道中向前走。

第三步：再换服装

复制代码

保持脸部、发型、眼睛和泪痣一致，将服装改为深蓝色短外套和黑色长裙。

第四步：再换风格

复制代码

保持角色身份和核心外貌一致，将画风调整为电影感插画。

一次只改一个大变量，成功率更高。

十、如果需要换服装，要保留脸部和标志性特征

很多角色一致性问题出现在"换衣服"时。

因为模型会把衣服也当成角色身份的一部分，一换衣服就容易换脸。

换服装时，要强调：

复制代码

只更换服装，不改变人物脸部、发型、发色、眼睛、肤色、体型和标志性泪痣。

示例

复制代码

继续使用同一位角色林夏。保持她的鹅蛋脸、深棕色锁骨微卷发、空气刘海、琥珀色杏仁眼、左眼下方小泪痣、白皙偏暖肤色和温柔气质不变。

这次只更换服装：让她穿一件深蓝色学院风西装外套、白衬衫和灰色百褶裙。

背景为校园樱花路。画风保持半写实日系插画。
要求：只改变服装和场景，不改变人物长相。

十一、如果需要换画风，要先锁定角色身份

从日系插画换成写实风、3D 风、像素风时，角色最容易变。

建议这样写：

复制代码

请将同一位角色林夏转换为新的画风，但保持她的核心身份特征。

然后列出必须保留的特征。

示例

复制代码

请把上一张图中的角色林夏转换为3D动画电影风格。

必须保留：
- 深棕色锁骨长度微卷发
- 空气刘海
- 琥珀色杏仁眼
- 左眼下方小泪痣
- 鹅蛋脸
- 温柔安静的气质
- 米白色针织开衫和浅蓝色连衣裙

只改变渲染风格，不改变人物身份和核心外貌。

十二、为角色设置"标志性符号"

如果角色没有明显特征，模型很容易漂移。

你可以人为设计一些稳定的视觉符号：

泪痣；
特定发夹；
特定颜色围巾；
独特耳环；
双色瞳；
固定纹身；
特定眼镜；
特定服装配色；
特殊刘海形状；
标志性道具。

例如：

复制代码

她总是戴着一个小小的银色月亮发夹。

或者：

复制代码

他的右手腕上有一条红绳手链。

这些符号可以成为模型识别同一角色的"锚"。

十三、不要使用过于抽象的描述

下面这些词对角色一致性的帮助有限：

复制代码

漂亮
高级
有气质
帅气
可爱
像女主角
很有辨识度
高级感
电影感

它们可以保留，但不能代替具体描述。

更有效的是：

复制代码

深棕色锁骨长度微卷发
空气刘海
琥珀色杏仁眼
左眼下方小泪痣
米白色针织开衫
浅蓝色连衣裙
细银项链
鹅蛋脸

角色一致性依赖的是可见特征，而不是抽象评价。

十四、负面提示也很重要

在提示词中加入"不要改变什么"，通常会有帮助。

示例

复制代码

不要改变她的发型、发色、脸型、眼睛颜色、服装颜色、配饰和泪痣。
不要让她变成短发。
不要改变年龄感。
不要换成其他人物。
不要加入多余人物。
不要改变画风。

但是要注意，负面提示不要写得太杂。

重点限制最容易出错的部分即可。

十五、常见问题与解决办法

问题 1：每张脸都不一样

解决方法：

先生成角色正面基准图；
后续上传参考图；
每次重复脸部特征；
不要频繁切换画风；
不要一开始就用复杂镜头。

问题 2：发型经常变

解决方法：

把发型写得更具体：

复制代码

深棕色锁骨长度微卷发，空气刘海，发尾微微内扣，两侧有自然碎发。

并加入限制：

复制代码

不要短发，不要长直发，不要高马尾，不要改变刘海。

问题 3：服装细节丢失

解决方法：

减少服装复杂度，保留最关键元素。

例如不要写：

复制代码

带有复杂刺绣、蕾丝、渐变、金属扣、透明纱、蝴蝶结、珠链的长裙

可以写：

复制代码

浅蓝色连衣裙，白色小领口，裙摆到膝盖，外搭米白色针织开衫。

越复杂越容易丢。

问题 4：换角度后不像同一个人

解决方法：

先生成多视角设定图，再做分镜。

或者分阶段生成：

正面；
三分之二侧脸；
侧脸；
背影。

不要直接从正面跳到极端俯视或背影。

问题 5：角色年龄变化

解决方法：

明确年龄感：

复制代码

24岁年轻女性，成年但有柔和少女感，不要幼态化，不要成熟到30岁以上。

或者：

复制代码

10岁小男孩，儿童比例，不要画成青少年。

十六、适合系列创作的工作流

如果你要做一本绘本、漫画或短视频封面系列，可以按这个流程：

Step 1：角色文字设定

先写角色圣经，确定不可变特征。

Step 2：生成角色基准图

正面半身，背景简单。

Step 3：生成三视图和表情表

正面、侧面、背面、常用表情。

Step 4：确定画风

比如：

复制代码

半写实日系插画，柔和光影，低饱和色彩，细腻线条。

后续不要频繁改变。

Step 5：逐张生成分镜

每张图都引用：

同一角色；
固定外貌；
当前动作；
当前场景；
不要改变项。

Step 6：局部修正

如果某一张只有小问题，比如泪痣没了、发夹位置错了，可以要求：

复制代码

请保持整张图不变，只补上左眼下方的小泪痣。

或：

复制代码

请保持人物姿势、表情和背景不变，只把头发改回深棕色锁骨长度微卷发。

十七、实用提示词合集

1. 创建角色基准图

复制代码

请生成一张角色基准图。

角色：林夏，24岁女性，鹅蛋脸，白皙偏暖肤色，深棕色锁骨长度微卷发，空气刘海，琥珀色杏仁眼，左眼下方有一颗小泪痣。她穿米白色针织开衫，内搭浅蓝色连衣裙，戴细银项链和圆形小耳钉。气质安静、温柔、略带书卷气。

画风：半写实日系插画，柔和光影，干净浅色背景。
构图：正面半身像，人物居中，清晰展示脸部和服装。
要求：作为后续所有图片的角色参考，人物特征要清晰稳定。

2. 保持角色一致，换场景

复制代码

继续使用上一张图中的同一位角色林夏。保持她的鹅蛋脸、深棕色锁骨长度微卷发、空气刘海、琥珀色杏仁眼、左眼下方小泪痣、米白色针织开衫、浅蓝色连衣裙和细银项链不变。

新场景：她坐在安静的咖啡馆靠窗位置，双手捧着热咖啡，微微低头微笑。窗外下着小雨，室内灯光温暖。

画风保持半写实日系插画，柔和光影。
要求：只改变场景和姿势，不改变人物外貌、服装和气质。

3. 保持角色一致，换动作

复制代码

请继续绘制同一位角色林夏，保持脸部、发型、发色、眼睛颜色、泪痣、服装和配饰与上一张图一致。

这次让她站在书店门口，一只手抱着书，另一只手轻轻整理头发，露出温柔微笑。

中景构图，三分之二侧脸，背景轻微虚化。

4. 保持角色一致，换服装

复制代码

继续使用同一位角色林夏。保持她的鹅蛋脸、深棕色锁骨长度微卷发、空气刘海、琥珀色杏仁眼、左眼下方小泪痣、白皙偏暖肤色和温柔气质不变。

只更换服装：她穿深蓝色学院风西装外套、白衬衫、灰色百褶裙，仍然戴细银项链。

场景：春天校园樱花路。
要求：只改变服装和场景，不改变人物长相、发型和年龄感。

5. 保持角色一致，做多张分镜

复制代码

请基于同一位角色林夏生成四格分镜，确保四格中的人物都是同一个人。

固定特征：
深棕色锁骨长度微卷发，空气刘海，琥珀色杏仁眼，左眼下方小泪痣，鹅蛋脸，白皙偏暖肤色，米白色针织开衫，浅蓝色连衣裙，细银项链，温柔安静的气质。

四格内容：
1. 她推开书店的门。
2. 她在书架前寻找书。
3. 她拿到一本旧书，露出惊喜表情。
4. 她坐在窗边阅读，阳光洒在脸上。

画风：半写实日系插画，柔和光影。
要求：四格人物必须保持同一张脸、同一发型、同一服装和同一气质。

十八、一个简单但高效的固定公式

你可以记住这个公式：

复制代码

同一角色 + 固定特征 + 当前变化 + 画风一致 + 禁止改变项

套成一句话就是：

复制代码

继续使用上一张图中的同一位角色，保持她的发型、脸型、眼睛、标志性特征、服装和气质不变；这次只改变场景和动作；画风与上一张一致；不要改变人物身份、年龄、发色、服装和配饰。

总结

想在 ChatGPT Images 多轮对话中保持人物形象统一，核心方法是：

先建立角色圣经：明确年龄、脸型、发型、服装、配饰和气质。
生成角色基准图：先做干净的正面半身像。
每轮重复关键特征：不要完全依赖上下文。
使用参考图：如果支持上传图片，一定要用。
区分固定特征和可变特征：人物不变，场景、动作、表情变化。
一次不要改太多变量：先换场景，再换动作，再换服装。
设置标志性符号：泪痣、发夹、耳环、项链等能显著提高一致性。
用结构化提示词：角色身份、固定外貌、当前场景、镜头语言、画风、限制条件。

一句话概括：

角色一致性不是靠一句"保持一致"实现的，而是靠"稳定的视觉锚点 + 参考图 + 结构化提示词 + 渐进式修改"实现的。