**摘要:**文章介绍了在 ChatGPT Images 2.0 多轮图像生成中保持角色一致的方法。核心是不要只写"保持一致",而要建立完整的角色设定,包括年龄、脸型、发型、眼睛、服装、配饰和标志性特征等视觉锚点。创作时应先生成正面角色基准图或三视图,作为后续参考;每轮生成都要重复关键特征,并明确哪些不可改变、哪些可以变化,如场景、动作和表情。若支持上传图片,应结合参考图和文字提示。为避免角色漂移,应一次只改变少量变量,换服装或画风时尤其要锁定脸部、发型和标志性符号。总体来说,角色一致性依赖稳定设定、参考图、结构化提示词和渐进式修改流程。
在使用 ChatGPT Images / 图像生成模型做漫画、绘本、分镜、IP 角色海报时,最常见的问题之一就是:第一张图很好看,但第二张开始人物就变了。
比如:
- 发型变了;
- 脸型变了;
- 服装细节丢了;
- 眼睛颜色不一致;
- 年龄感变化;
- 同一个角色在不同镜头里像不同人。
要想在多轮对话中保持人物形象统一,关键不是只写一句"保持角色一致",而是要建立一套角色设定、视觉锚点、参考图、提示词结构和迭代流程。
下面是基于库拉 镜像平台(https 传**://ouai** 送**.me/** 门)的 Image 2.0的一套实战方法。
一、先建立"角色圣经":不要只描述,要锁定视觉锚点
角色一致性的核心是:让模型在每一轮都能抓住同一个人的关键特征。
你需要为角色建立一份固定设定,也可以叫:
- 角色圣经;
- Character Bible;
- 角色视觉档案;
- 人物一致性提示词。
示例:角色设定模板
角色名称:林夏
年龄:24岁
性别:女性
体型:身高约165cm,身材纤细,肩膀窄,姿态轻盈
脸型:鹅蛋脸,下巴较柔和
肤色:白皙偏暖
发型:深棕色中长发,长度到锁骨,微卷,空气刘海
眼睛:杏仁眼,琥珀色瞳孔,眼神温柔
鼻子:小巧挺直
嘴唇:自然粉色,唇形柔和
标志性特征:左眼下方有一颗很小的泪痣
服装:米白色针织开衫,内搭浅蓝色连衣裙
配饰:细银项链,圆形小耳钉
气质:安静、温柔、略带书卷气
画风:半写实日系插画,柔和光影,干净背景
这个设定越稳定,后续越容易保持一致。
二、给角色设计"不可变特征"和"可变特征"
很多人提示词写得太散,导致模型不知道哪些必须固定,哪些可以变化。
建议把角色拆成两类:
1. 不可变特征
这些是每一轮都必须保留的:
必须保持不变:
- 深棕色锁骨长度微卷发
- 空气刘海
- 琥珀色杏仁眼
- 左眼下方小泪痣
- 米白色针织开衫
- 浅蓝色连衣裙
- 细银项链
- 温柔安静的气质
2. 可变特征
这些可以根据画面变化:
可以变化:
- 姿势
- 表情
- 镜头角度
- 背景环境
- 光线
- 手部动作
- 画面构图
这样模型会更清楚:人物不变,场景和动作变化。
三、第一张图最重要:先生成"角色基准图"
不要一开始就生成复杂场景。
建议第一步先生成一张干净、正面的角色设定图。
示例提示词
请生成一张角色设定图。
角色名称:林夏。
她是一位24岁的年轻女性,身材纤细,鹅蛋脸,白皙偏暖肤色。她有深棕色锁骨长度微卷发,空气刘海,琥珀色杏仁眼,左眼下方有一颗很小的泪痣。她穿着米白色针织开衫,内搭浅蓝色连衣裙,戴细银项链和圆形小耳钉。她的气质安静、温柔、略带书卷气。
画风:半写实日系插画,柔和光影,干净浅色背景。
构图:正面半身像,人物居中,清晰展示脸部、发型、服装和配饰。
要求:不要夸张表情,不要复杂背景,不要改变上述外貌特征。
第一张图的目标不是"好看炸裂",而是建立角色标准形象。
生成后,如果满意,可以把它作为后续对话中的参考图或视觉基准。
四、多轮生成时,始终引用"这位角色"
当你有了基准图之后,后续不要重新描述成另一个人,而是要明确告诉模型:
继续使用上一张图中的同一位女性角色。
同时补充关键特征。
示例:生成咖啡馆场景
请继续使用上一张图中的同一位女性角色林夏,保持她的脸型、发型、发色、琥珀色眼睛、左眼下方的小泪痣、米白色针织开衫、浅蓝色连衣裙和细银项链不变。
这次请画她坐在安静的咖啡馆靠窗位置,双手捧着一杯热咖啡,微微低头微笑。窗外是下雨的街道,室内有温暖的黄色灯光。
画风保持半写实日系插画,柔和光影,色调温暖。
要求:人物必须与上一张图保持一致,只改变场景、姿势和表情。
重点是这句话:
只改变场景、姿势和表情,不改变人物身份、脸部特征、发型、服装和配饰。
五、每次都重复关键特征,不要完全依赖上下文
虽然多轮对话有上下文,但图像生成对细节的记忆并不总是稳定。
所以,每次生成都建议重复核心特征。
不要只写:
让她去公园。
而是写:
继续使用同一位角色林夏:深棕色锁骨长度微卷发、空气刘海、琥珀色杏仁眼、左眼下方小泪痣,穿米白色针织开衫和浅蓝色连衣裙。让她出现在春天的公园里,坐在长椅上读书。
模型每次看到清晰的角色锚点,稳定性会高很多。
六、使用"角色一致性提示词结构"
你可以固定一个提示词结构,每一张图都按这个格式写。
通用结构
【角色身份】
继续使用上一张图中的同一位角色:角色名。
【固定外貌】
保持以下特征不变:发型、发色、眼睛、脸型、肤色、标志性特征、服装、配饰、气质。
【当前场景】
这次她在什么地方、做什么动作、有什么表情。
【镜头语言】
半身/全身/特写,正面/侧面/俯视/仰视,近景/中景/远景。
【画风】
保持与前图一致的画风、光影、色彩和质感。
【限制】
不要改变人物年龄、脸型、发型、发色、服装、配饰和标志性特征。
示例
【角色身份】
继续使用上一张图中的同一位角色林夏。
【固定外貌】
她是24岁女性,鹅蛋脸,白皙偏暖肤色,深棕色锁骨长度微卷发,空气刘海,琥珀色杏仁眼,左眼下方有一颗小泪痣。她穿米白色针织开衫,内搭浅蓝色连衣裙,戴细银项链和圆形小耳钉。气质安静温柔。
【当前场景】
她站在图书馆书架之间,手里拿着一本打开的书,微微侧头看向镜头,表情温柔。
【镜头语言】
中景,三分之二侧脸,人物居中,背景轻微虚化。
【画风】
半写实日系插画,柔和自然光,干净细腻的笔触。
【限制】
必须保持人物与上一张图一致,只改变场景和姿势,不改变发型、服装、脸部特征和标志性泪痣。
七、用"角色三视图"提升稳定性
如果要做系列内容,建议先生成一张角色三视图:
- 正面;
- 侧面;
- 背面;
- 可加不同表情。
提示词示例
请为角色林夏生成一张角色三视图设定图。
角色保持以下设定:24岁女性,鹅蛋脸,白皙偏暖肤色,深棕色锁骨长度微卷发,空气刘海,琥珀色杏仁眼,左眼下方有一颗小泪痣。穿米白色针织开衫,内搭浅蓝色连衣裙,戴细银项链和圆形小耳钉。
画面包括:
1. 正面站姿
2. 侧面站姿
3. 背面站姿
4. 三个小表情头像:微笑、惊讶、认真
要求:角色在所有视角中保持同一人,发型、服装、体型和气质一致。背景简洁,类似动画角色设定表。
三视图适合用于:
- 漫画分镜;
- 游戏角色设定;
- 绘本角色;
- 短视频封面系列;
- IP 表情包。
八、用"参考图 + 文本锚点"双重约束
如果工具支持上传图片,推荐采用:
- 上传基准角色图;
- 在提示词中说明"以这张图为角色参考";
- 再重复关键文本特征。
示例
请以我上传的图片作为角色外貌参考,继续绘制同一位女性角色林夏。
必须保持:
- 脸型一致
- 发型一致
- 发色一致
- 琥珀色眼睛一致
- 左眼下方小泪痣一致
- 米白色针织开衫和浅蓝色连衣裙一致
- 温柔安静的气质一致
新画面:她在黄昏的海边散步,微风吹动头发,手里拿着一本书。画风、人物比例和面部风格与参考图保持一致。
这样比单纯文字描述稳定得多。
九、避免一次性改变太多变量
角色崩掉的常见原因是:
你同时改变了场景、服装、姿势、镜头角度、画风、年龄、表情。
例如:
让她穿战斗服,在赛博朋克城市里奔跑,镜头俯视,强烈霓虹光,写实电影风。
这很容易导致角色变化。
更稳定的方法是逐步变化:
第一步:只换场景
保持角色完全一致,只把背景换成夜晚城市街道。
第二步:再换动作
保持角色一致,让她在夜晚城市街道中向前走。
第三步:再换服装
保持脸部、发型、眼睛和泪痣一致,将服装改为深蓝色短外套和黑色长裙。
第四步:再换风格
保持角色身份和核心外貌一致,将画风调整为电影感插画。
一次只改一个大变量,成功率更高。
十、如果需要换服装,要保留脸部和标志性特征
很多角色一致性问题出现在"换衣服"时。
因为模型会把衣服也当成角色身份的一部分,一换衣服就容易换脸。
换服装时,要强调:
只更换服装,不改变人物脸部、发型、发色、眼睛、肤色、体型和标志性泪痣。
示例
继续使用同一位角色林夏。保持她的鹅蛋脸、深棕色锁骨微卷发、空气刘海、琥珀色杏仁眼、左眼下方小泪痣、白皙偏暖肤色和温柔气质不变。
这次只更换服装:让她穿一件深蓝色学院风西装外套、白衬衫和灰色百褶裙。
背景为校园樱花路。画风保持半写实日系插画。
要求:只改变服装和场景,不改变人物长相。
十一、如果需要换画风,要先锁定角色身份
从日系插画换成写实风、3D 风、像素风时,角色最容易变。
建议这样写:
请将同一位角色林夏转换为新的画风,但保持她的核心身份特征。
然后列出必须保留的特征。
示例
请把上一张图中的角色林夏转换为3D动画电影风格。
必须保留:
- 深棕色锁骨长度微卷发
- 空气刘海
- 琥珀色杏仁眼
- 左眼下方小泪痣
- 鹅蛋脸
- 温柔安静的气质
- 米白色针织开衫和浅蓝色连衣裙
只改变渲染风格,不改变人物身份和核心外貌。
十二、为角色设置"标志性符号"
如果角色没有明显特征,模型很容易漂移。
你可以人为设计一些稳定的视觉符号:
- 泪痣;
- 特定发夹;
- 特定颜色围巾;
- 独特耳环;
- 双色瞳;
- 固定纹身;
- 特定眼镜;
- 特定服装配色;
- 特殊刘海形状;
- 标志性道具。
例如:
她总是戴着一个小小的银色月亮发夹。
或者:
他的右手腕上有一条红绳手链。
这些符号可以成为模型识别同一角色的"锚"。
十三、不要使用过于抽象的描述
下面这些词对角色一致性的帮助有限:
漂亮
高级
有气质
帅气
可爱
像女主角
很有辨识度
高级感
电影感
它们可以保留,但不能代替具体描述。
更有效的是:
深棕色锁骨长度微卷发
空气刘海
琥珀色杏仁眼
左眼下方小泪痣
米白色针织开衫
浅蓝色连衣裙
细银项链
鹅蛋脸
角色一致性依赖的是可见特征,而不是抽象评价。
十四、负面提示也很重要
在提示词中加入"不要改变什么",通常会有帮助。
示例
不要改变她的发型、发色、脸型、眼睛颜色、服装颜色、配饰和泪痣。
不要让她变成短发。
不要改变年龄感。
不要换成其他人物。
不要加入多余人物。
不要改变画风。
但是要注意,负面提示不要写得太杂。
重点限制最容易出错的部分即可。
十五、常见问题与解决办法
问题 1:每张脸都不一样
解决方法:
- 先生成角色正面基准图;
- 后续上传参考图;
- 每次重复脸部特征;
- 不要频繁切换画风;
- 不要一开始就用复杂镜头。
问题 2:发型经常变
解决方法:
把发型写得更具体:
深棕色锁骨长度微卷发,空气刘海,发尾微微内扣,两侧有自然碎发。
并加入限制:
不要短发,不要长直发,不要高马尾,不要改变刘海。
问题 3:服装细节丢失
解决方法:
减少服装复杂度,保留最关键元素。
例如不要写:
带有复杂刺绣、蕾丝、渐变、金属扣、透明纱、蝴蝶结、珠链的长裙
可以写:
浅蓝色连衣裙,白色小领口,裙摆到膝盖,外搭米白色针织开衫。
越复杂越容易丢。
问题 4:换角度后不像同一个人
解决方法:
先生成多视角设定图,再做分镜。
或者分阶段生成:
- 正面;
- 三分之二侧脸;
- 侧脸;
- 背影。
不要直接从正面跳到极端俯视或背影。
问题 5:角色年龄变化
解决方法:
明确年龄感:
24岁年轻女性,成年但有柔和少女感,不要幼态化,不要成熟到30岁以上。
或者:
10岁小男孩,儿童比例,不要画成青少年。
十六、适合系列创作的工作流
如果你要做一本绘本、漫画或短视频封面系列,可以按这个流程:
Step 1:角色文字设定
先写角色圣经,确定不可变特征。
Step 2:生成角色基准图
正面半身,背景简单。
Step 3:生成三视图和表情表
正面、侧面、背面、常用表情。
Step 4:确定画风
比如:
半写实日系插画,柔和光影,低饱和色彩,细腻线条。
后续不要频繁改变。
Step 5:逐张生成分镜
每张图都引用:
- 同一角色;
- 固定外貌;
- 当前动作;
- 当前场景;
- 不要改变项。
Step 6:局部修正
如果某一张只有小问题,比如泪痣没了、发夹位置错了,可以要求:
请保持整张图不变,只补上左眼下方的小泪痣。
或:
请保持人物姿势、表情和背景不变,只把头发改回深棕色锁骨长度微卷发。
十七、实用提示词合集
1. 创建角色基准图
请生成一张角色基准图。
角色:林夏,24岁女性,鹅蛋脸,白皙偏暖肤色,深棕色锁骨长度微卷发,空气刘海,琥珀色杏仁眼,左眼下方有一颗小泪痣。她穿米白色针织开衫,内搭浅蓝色连衣裙,戴细银项链和圆形小耳钉。气质安静、温柔、略带书卷气。
画风:半写实日系插画,柔和光影,干净浅色背景。
构图:正面半身像,人物居中,清晰展示脸部和服装。
要求:作为后续所有图片的角色参考,人物特征要清晰稳定。
2. 保持角色一致,换场景
继续使用上一张图中的同一位角色林夏。保持她的鹅蛋脸、深棕色锁骨长度微卷发、空气刘海、琥珀色杏仁眼、左眼下方小泪痣、米白色针织开衫、浅蓝色连衣裙和细银项链不变。
新场景:她坐在安静的咖啡馆靠窗位置,双手捧着热咖啡,微微低头微笑。窗外下着小雨,室内灯光温暖。
画风保持半写实日系插画,柔和光影。
要求:只改变场景和姿势,不改变人物外貌、服装和气质。
3. 保持角色一致,换动作
请继续绘制同一位角色林夏,保持脸部、发型、发色、眼睛颜色、泪痣、服装和配饰与上一张图一致。
这次让她站在书店门口,一只手抱着书,另一只手轻轻整理头发,露出温柔微笑。
中景构图,三分之二侧脸,背景轻微虚化。
4. 保持角色一致,换服装
继续使用同一位角色林夏。保持她的鹅蛋脸、深棕色锁骨长度微卷发、空气刘海、琥珀色杏仁眼、左眼下方小泪痣、白皙偏暖肤色和温柔气质不变。
只更换服装:她穿深蓝色学院风西装外套、白衬衫、灰色百褶裙,仍然戴细银项链。
场景:春天校园樱花路。
要求:只改变服装和场景,不改变人物长相、发型和年龄感。
5. 保持角色一致,做多张分镜
请基于同一位角色林夏生成四格分镜,确保四格中的人物都是同一个人。
固定特征:
深棕色锁骨长度微卷发,空气刘海,琥珀色杏仁眼,左眼下方小泪痣,鹅蛋脸,白皙偏暖肤色,米白色针织开衫,浅蓝色连衣裙,细银项链,温柔安静的气质。
四格内容:
1. 她推开书店的门。
2. 她在书架前寻找书。
3. 她拿到一本旧书,露出惊喜表情。
4. 她坐在窗边阅读,阳光洒在脸上。
画风:半写实日系插画,柔和光影。
要求:四格人物必须保持同一张脸、同一发型、同一服装和同一气质。
十八、一个简单但高效的固定公式
你可以记住这个公式:
同一角色 + 固定特征 + 当前变化 + 画风一致 + 禁止改变项
套成一句话就是:
继续使用上一张图中的同一位角色,保持她的发型、脸型、眼睛、标志性特征、服装和气质不变;这次只改变场景和动作;画风与上一张一致;不要改变人物身份、年龄、发色、服装和配饰。
总结
想在 ChatGPT Images 多轮对话中保持人物形象统一,核心方法是:
- 先建立角色圣经:明确年龄、脸型、发型、服装、配饰和气质。
- 生成角色基准图:先做干净的正面半身像。
- 每轮重复关键特征:不要完全依赖上下文。
- 使用参考图:如果支持上传图片,一定要用。
- 区分固定特征和可变特征:人物不变,场景、动作、表情变化。
- 一次不要改太多变量:先换场景,再换动作,再换服装。
- 设置标志性符号:泪痣、发夹、耳环、项链等能显著提高一致性。
- 用结构化提示词:角色身份、固定外貌、当前场景、镜头语言、画风、限制条件。
一句话概括:
角色一致性不是靠一句"保持一致"实现的,而是靠"稳定的视觉锚点 + 参考图 + 结构化提示词 + 渐进式修改"实现的。