【愚公系列】《AI漫剧创作一本通》010-角色设定、场景设计与道具设计(提示词直出与参考图生图的区别)

💎【行业认证·权威头衔】

✔ 华为云天团核心成员:特约编辑/云享专家/开发者专家/产品云测专家

✔ 开发者社区全满贯:CSDN博客&商业化双料专家/阿里云签约作者/腾讯云内容共创官/掘金&亚马逊&51CTO顶级博主

✔ 技术生态共建先锋:横跨鸿蒙、云计算、AI等前沿领域的技术布道者

🏆【荣誉殿堂】

🎖 连续三年蝉联"华为云十佳博主"(2022-2024)

🎖 双冠加冕CSDN"年度博客之星TOP2"(2022&2023)

🎖 十余个技术社区年度杰出贡献奖得主

📚【知识宝库】

覆盖全栈技术矩阵:

◾ 编程语言:.NET/Java/Python/Go/Node...

◾ 移动生态:HarmonyOS/iOS/Android/小程序

◾ 前沿领域:物联网/网络安全/大数据/AI/元宇宙

◾ 游戏开发:Unity3D引擎深度解析

文章目录


🚀前言

我们完成了从市场定位到剧本框架的系统梳理。剧本构建了故 事的骨架,而本章将为其填充血肉。在正式调用AI 绘图工具生成画面之前,有 一个至关重要的步骤往往被初学者忽略,那就是对角色的深度理解。

如果说剧本决定了"讲什么故事",那么角色设计、场景设计与道具设计就 共同决定了"这个故事由谁在怎样的世界中展开"。

🚀一、提示词直出与参考图生图的区别

AI角色图的生成主要有两条路径:提示词直出参考图生图。这分别对应传统动画制作中的零基础造型设计(从无到有)与基于已有素材的风格统一化处理(从有到优)。理解二者的差异与应用场景,能有效提升角色开发的效率与成品的一致性。

维度 提示词直出 参考图生图
核心价值 探索与迭代,确定角色大方向 统一风格,保证多角色视觉一致性
适用阶段 初期角色设计、探索多种可能性 已有核心角色,需要扩展配角或保持多图统一
输入方式 仅文本描述 文本描述 + 参考图片(风格/角色图)
输出特点 多样性高,每次结果有随机波动 稳定性强,风格高度可控
典型工具 Midjourney、DALL·E、即梦AI 即梦AI参考图模式、Midjourney ---cref / ---sref

🔎1.提示词直出角色

提示词直出的核心价值在于探索与迭代,往往难以一次性得到完美的终稿。通过多轮生成与筛选,创作者可以逐步明确角色的整体方向。

在实际操作中,建议参考以下四步流程

🦋第一步:批量生成,探索边界("抽卡"阶段)

该步骤旨在探索可能性的边界。在这一阶段,应保持提示词完全一致,一次性生成8~12张图片。其目的并非筛选优劣,而是观察模型在同一语义约束下会呈现出怎样不同的解读,包括:

  • 人物的体态、气质走向
  • 画面整体风格的自然波动(如光影、笔触、色彩倾向)

关键认知:只有样本数量足够充分,后续的审美判断与方向锁定才有参考意义。不要只生成2~3张就急于下结论。

🦋第二步:粗筛,关注整体而非细节

在进行判断时,须有意识地回避细节 ,重点关注角色是否在整体上"成立"。具体检查点:

检查项 说明
比例协调性 头身比例是否合理?是否符合角色的年龄、身份?
性格可读性 角色的性格特征能否通过姿态、神情和画面氛围被直观感知?
色彩稳定性 整体色彩倾向是否与作品既定的风格体系保持一致?

注意:此时,轻微的结构偏差(如手指略有问题)、局部失真或精细度不足,都不应作为首要调整对象。这些可以在后续精修阶段解决。

🦋第三步:锚定,挑选2~3张作为"风格锚点"

在通过初筛的图片中,挑选2~3张最接近理想方向的版本。这些图片的价值并不在于细节是否完美,而在于:

  • 整体方向是否清晰
  • 气质表现是否稳定

它们将作为后续生成的视觉参照标准,用来锁定角色的视觉边界,避免在反复生成中出现风格漂移或偏离。

实操建议:为每张锚点图片记录完整的提示词、种子值(Seed)和生成参数,以便后续复用。

🦋第四步:精修,在锚点基础上迭代优化

当角色的大方向已经确定后,就可以在已建立的风格锚点基础上,借助以图生图参考图功能(对应下一节),对角色进行细节层面的逐步优化:

  • 面部结构的稳定性(如眼睛大小一致、五官位置准确)
  • 服装与道具的逻辑一致性(如左右对称、褶皱合理)
  • 光影和质感的统一(如皮肤材质、布料反光)

这一阶段的修改目标明确,调整路径清晰,核心任务是把已经确立的方向推向更高的完成度,而非重新探索方向。

总结 :提示词直出的关键价值在于"确定方向"。先锁定角色的整体形态和气质基调,再进入细节精修环节,才能有效避免反复试错,提高角色开发的整体效率。

🔎2.参考图生成角色

在确定了一个或几个核心角色后,创作者面临的挑战便从"个体设计"转向"整体统一 "。核心问题在于:确保作品中所有登场人物处于同一个世界观下,遵循相同的视觉法则。在传统动画工业中,这属于美术总监的职责范围;而在AI漫剧的工作流中,这一目标主要依靠"参考图"与"风格一致性控制"来实现。

同一个漫剧项目,应当严格遵循统一的画风参考标准。具体操作可以分为以下三个关键步骤

🦋步骤一:建立风格参考库(确定"画风母版")

这一步决定了整个作品的视觉基调。创作者可从以下平台或图库中,收集符合项目预期风格、色调与氛围的参考图:

平台 特点 适用场景
即梦AI(社区) 国产,风格丰富,有大量国漫/日漫风格 快速找灵感
快看漫画 成熟商业漫画风格 研究主流漫剧审美
LiblibAI 模型库丰富,可在线试画 寻找特定LoRA或风格模型
Pinterest 全球视觉灵感库 收集各类美术风格参考

将收集到的参考图统一上传至AI绘图工具中进行初步的风格测试与适配(如图3-5、图3-6所示),确认模型能够稳定输出该风格。

建议:至少收集5-10张高质量参考图,涵盖角色、场景、光影三个维度。

🦋步骤二:锁定生成逻辑(控制变量法)

生成配角或其他次要角色时,必须严格保持底层参数的一致性。这要求创作者始终使用:

  • 同一个基础模型(如同一款大模型或LoRA)
  • 同一套基础提示词架构(如画风描述、光影描述、画质描述)

变量的调整仅限于角色的个性化特征,例如:

  • 发型、发色
  • 脸型(圆脸/方脸/瓜子脸)
  • 瞳色、眼睛形状
  • 服饰设计与配饰

通过控制变量法 ,确保角色在生理特征与身份标识上有所区分,但在笔触质感、材质表现和渲染风格上保持高度统一。

错误示例

  • 主角用"厚涂油画风",配角用"赛璐璐平涂风" → 违和
  • 主角用"高饱和度色彩",配角用"低饱和度莫兰迪色" → 违和

正确做法:所有角色共享相同的"画风公式"。

🦋步骤三:统一光照与环境(消除光影违和感)

这一步用于严格控制光照与环境逻辑。画面视觉不统一往往源于光影设定的混乱

在生成过程中,应确保所有角色处于相似的光照环境与质感基调中。例如:

  • 统一设定为柔和的侧光均匀的漫反射光
  • 明确光源方向(如"左上侧光"),所有角色保持一致

反面案例:如果部分角色呈现强烈的戏剧化顶光(如舞台追光),而另一部分采用平淡的正面光(如证件照),拼合在同一场景时会产生明显的违和感,破坏画面的整体叙事可信度。

实操技巧:在提示词中固定光照关键词,例如:

  • 柔光,漫反射,无明显阴影
  • 电影感布光,主光来自左上,暖色调
  • 平面光,均匀照明,适合漫画合成

🔎提示词直出 + 参考图生图 = 完整角色库闭环

路径 解决的核心问题 产出
提示词直出 "个体"的审美与设定------确保单个人物足够美观且符合人设 核心角色方向、风格锚点
参考图生图 "整体"的视觉逻辑------确保所有角色同框时自然统一 完整角色资产库(主角+配角+龙套)

只有将二者结合,才能完成一套成熟的漫剧角色资产库:先用提示词直出"跑"出主角的独特形象,再用参考图生图"扩"展到整个故事世界。

🚀附:AI提示词模板与完整回答示例

以下提供一个针对提示词直出角色(探索阶段) 的完整提示词模板,以及基于该模板的完整回答示例。该模板遵循前文所述的"7要素框架",并加入了批量生成所需的参数说明。

🔎提示词模板(可直接复制使用)

复制代码
【任务】生成一个[男频/女频][题材类型]AI漫剧角色的全身立绘图,用于初步风格探索。

【输出要求】请输出一段完整的中文AI绘图提示词,并附上生成参数建议。

【提示词结构要求】
严格按以下顺序组织:
1. 类型与画风:2D动漫,[风格关键词](例如:国漫/日式赛博/古风仙侠),[线条描述](硬朗/细腻),[光影描述](高对比/柔光)
2. 基本属性:[性别],[年龄段],[职业/身份]
3. 身材与站姿:[体型],[身高感],[姿态]
4. 头部与五官:[脸型],[发型+发色],[眼睛形态+瞳色],[特殊标记(如痣/伤疤)]
5. 服装与配饰:[上装],[下装],[鞋子],[标志性配件]
6. 表情与气质:[表情词],[气质词]
7. 画面规格:全身正视图,纯白背景,9:16竖构图,高精细线稿与上色,无道具,无其他人物,无文字

【生成参数建议】
- 批量生成数量:8-12张
- 建议使用的模型:[例如:Midjourney V6 / 即梦动漫专业模型 / DALL·E 3]
- 宽高比:9:16
- 风格化参数(如有):中等偏高(如MJ的---s 250)

【注意】提示词中必须包含对鞋子的具体描述,避免画面截断。

🔎完整回答示例(基于模板,假设用户需要生成一个男频玄幻废柴逆袭型主角)

用户需求:《灵剑仙途》男频玄幻AI漫剧,主角林风,16-18岁,外门弟子,废柴但隐藏天赋,外表隐忍沉默。

AI回答(完整提示词 + 生成参数)

🦋提示词正文

复制代码
2D动漫,国漫玄幻风格,线条清晰硬朗,对比度中等偏高,硬阴影。男性,17岁,外门弟子。体型偏瘦,身高约175cm,站姿微微含背,双手自然下垂但不显懦弱。脸型清瘦,轮廓有少年感但已有棱角。黑色短发,刘海略长半遮额头,发丝有一点点凌乱。瞳色深黑,但高光处隐约透出一丝金色。皮肤偏白,没有明显瑕疵。身穿灰白色粗布外门弟子长袍,衣领和袖口有磨损的旧化处理,腰间系一条深灰色布带。脚穿黑色软底布鞋,鞋面有些灰尘。双耳无配饰,左手腕缠着一圈旧绷带。表情平静,嘴角微抿,眉头似有似无地微蹙,眼神低垂但仍能看出内心的坚韧。气质沉默、隐忍,带有一种压抑的锐利感。全身站立正视图,单人,纯白背景,9:16竖构图,高精细线稿与上色,无道具,无其他人物,无文字。

生成参数建议

参数项 推荐值
模型 即梦AI「国漫专业模型」或 Midjourney V6(使用---niji 6)
批量生成数量 10张
宽高比 9:16
风格化(---s / 类似参数) 250(中等偏高,保持多样性)
种子值(Seed) 随机(首次探索不固定)

下一步操作提示

  1. 使用上述提示词生成10张图;
  2. 按"整体成立"原则粗筛,保留3-4张比例协调、气质符合的图;
  3. 从中挑选2张最满意的作为风格锚点,记录其种子值;
  4. 如需精修,请进入「参考图生图」模式,将锚点图作为参考图,并在提示词中微调细节(如"眼神更锐利""衣领加上金色镶边")。
相关推荐
qyz_hr1 小时前
一体化HR系统凭什么更好用?从用户口碑看懂红海云的成功逻辑
人工智能
逆境不可逃1 小时前
Claude Skills 完全使用指南:从入门到自定义开发
人工智能·skill·claudecode·skills
一次旅行1 小时前
豆包突然宣布收费,3.45亿用户的好日子到头了?
人工智能
大数据在线1 小时前
千亿企业级存储市场,产品逻辑变了
人工智能·浪潮信息·智能体·ai存储·a9000
灵机一物1 小时前
灵机一物AI原生电商小程序、PC端(已上线)-AppLovin AI转型深度解析
人工智能
凤年徐1 小时前
保姆级教程:零成本在本地跑AI大模型_Ollama
人工智能
甲维斯1 小时前
3P骚操作!把DeepSeekV4直接接入Claude桌面版!
人工智能·ai编程
南湖渔歌1 小时前
yt-dlp下载bilibili的视频画质差咋办?
人工智能·python·workbuddy
ACP广源盛139246256731 小时前
磐石 100 :IX6012 :ASM1812@ACP#国产 PCIe 2.0 交换芯片,轻量级算力扩展应用分享
大数据·linux·运维·网络·人工智能·嵌入式硬件·电脑