【AI绘图新手必看】Nano Banana实战教学:从提示词到画面构图!

Nano Banana,大香蕉模型小名"纳米香蕉"是 Google/DeepMind 推出的图像生成/编辑子模型(Gemini 2.5 Flash Image 系列的俗称),以强大的一步/迭代图像编辑能力著称,特别擅长在保持主体一致性的前提下对已有照片进行复杂改造(如把真人变成微型摆件、换背景、服装替换、连贯的人物系列编辑等)。

单张/多张图像编辑、one-shot 风格替换、持续迭代保持角色一致、从照片生成风格化3D/半3D小模型/摆件、与 Photoshop等工具集成等。

下面给你一份 详尽的 Nano-banana(即 Google Gemini 的 "Nano Banana / Gemini 2.5 Flash Image")使用教程 ,包含:功能概览、逐步上手教程、Prompt 工程与技巧、10 个「神级玩法」案例(含提示词与步骤)、以及如何通过 神马中转 API 直接使用和配置并调用 Nano-banana(含示例代码)。

1. Nano Banana提示词Prompt工程(实战要点)

成功的图像编辑 prompt 通常要"分层、简洁、指向明确"------建议使用下面结构化模板(可复制粘贴改写),也可以直接复制下一部分提示词的示例直接快速上手:

复制代码
主体描述(谁 / 物);
动作或姿态(在做什么);
风格/细节(写明风格:写实 / 插画 / 纸雕 / 3D 小摆件);
光照/环境(时间/光源/相机角度);
材质/纹理(例如陶瓷、塑料、金属、迷你木雕);
保留或限制("保留面部表情/不要改变背景中 XX");
输出格式与修饰("高细节、4k、自然阴影、无文字")。

示例(将自拍变成太空宇航服风格):

复制代码
主体:正面自拍,微笑,年约25岁女性;
动作:面向镜头,头戴透明头盔,身体穿宇航服;
风格:科幻写实,细节丰富;
环境:太空背景,地球在远处,可见星云光晕;
光照:来自右上方的冷色主光,柔和反射;
保留:保留眼睛和面部特征;
输出:可用于头像,裁剪为方形

实用技巧

  • 分句写提示,短句比长段更稳定。

  • 使用否定短语(avoid / 不要)明确排除元素。

  • 用"参考图"或"参考关键词"提高风格一致性(如给出风格参考图或写"像 Studio Ghibli 风格")。

  • 若要多次迭代,记录每次 prompt 的改动点,方便复现与微调。

2. 10 个 Nano-banana「神级玩法」与示例提示词(每条含操作步骤与提示词)

下列玩法兼顾创意与可实现性,适用于社交媒体、商业设计、影视概念、个人创作等场景。

微型摆件 / 人像"摆件化"

思路:把真人照片转成桌面小摆件(mini figurine)风格,保留面部特征且做出"塑料/陶瓷"质感。

示例 prompt

复制代码
把主体变为一个桌面微型摆件,类似精致陶瓷人偶,头部细节保留,面部光滑有微光,底座木质,尺寸迷你,浅景深相机镜头,柔和环境光,背景为书桌模糊。保持面部表情不变。

步骤:上传清晰正面照 → 指定 mask(身体或背景)→ 选择"塑料/陶瓷"质感 → 迭代调整材质和阴影。

更换多种发型

输入: 需上传一张需要更换发型的人像图片

提示词:

复制代码
以九宫格的方式生成这个人不同发型的头像

电影海报级别场景重塑

示例 prompt

复制代码
把这张城市街拍重制为赛博朋克电影海报风格:霓虹灯、雨滴反射、冷暖对比、宽银幕构图、加深阴影、电影颗粒,保留主体姿态。

步骤:上传原图 → 指定 "风格:赛博朋克" → 要求"宽银幕构图+高对比"。

电影分镜

思路:需上传参考图像

提示

复制代码
用这两个角色创作一个令人上瘾的12部分故事,包含12张图像,讲述经典的黑色电影侦探故事。故事关于他们寻找线索并最终发现的失落的宝藏。整个故事充满刺激,有情感的高潮和低谷,以精彩的转折和高潮结尾。不要在图像中包含任何文字或文本,纯粹通过图像本身讲述故事在这张模特图上尝试三种未来感服装:1) 轻质反光外套 2) 高腰结构连衣 3) 层叠功能性战术装。每个输出保持模型脸部与姿态一致。

人物姿势修改

提示

复制代码
让图片中的人直视前方

线稿图生成图像

提示

复制代码
将图一人物换成图二姿势,专业摄影棚拍摄

物品包装生成

思路:需上传一张物品参考图像和一张包装参考图片

提示

复制代码
把图一贴在图二易拉罐上,并放在极简设计的布景中,专业摄影

动漫转真人Coser

输入: 需上传一张插画图像

提示词:

复制代码
生成一个女孩cosplay这张插画的照片,背景设置在Comiket

生成角色设定

输入: 需上传一张角色参考图像

提示词:

sql 复制代码
为我生成人物的角色设定(Character Design)

比例设定(不同身高对比、头身比等)

三视图(正面、侧面、背面)

表情设定(Expression Sheet) → 就是你发的那种图

动作设定(Pose Sheet) → 各种常见姿势

服装设定(Costume Design)

OOTD穿搭

输入: 需上传一张人物图片和服装图片

提示词:

复制代码
选择图1中的人,让他们穿上图2中的所有服装和配饰。在户外拍摄一系列写实的OOTD风格照片,使用自然光线,时尚的街头风格,清晰的全身镜头。保持图1中人物的身份和姿势,但以连贯时尚的方式展示图2中的完整服装和配饰

3. Nano-banana怎么用:四种常见使用方式(含操作步骤)

下面给出最常见的四种上手方式(带具体步骤)------如果你已经有图像,直接按其中一种走即可。

方式 A:在 Google Gemini / AI Studio 中使用(官方渠道)

  1. 打开 Gemini Image 编辑页面或 AI Studio(gemini.google / AI Studio)。选择 Gemini 2.5 Flash Image / Nano-banana 模型(有时称"Nano-banana"或"gemini-2-5-flash-image")。

  2. 上传你的原图(单张或多张参考图)。

  3. 在文本框输入你的编辑提示(prompt)。可分句写清楚要点:主体、动作/表情、风格、背景、光照、材质、要保留/删除的元素。

  4. 若支持 mask(蒙版),可用画笔圈出希望变动的区域,或标注需保留细节(例如"保留左耳环细节")。

  5. 生成后使用"迭代"或"变体"功能微调;每轮在 prompt 里加上"更强的光照/更逼真的阴影/保留脸部特征"等指示。

备注:通过官方界面通常能得到最佳一致性与合规性(并可能带有不可见的 SynthID 水印用于标识 AI 生成图像)。

方式 B:通过第三方应用或插件(例如 Photoshop 集成)

  • 如果你是设计师,Nano-banana 已被部分工具支持为模型选项,直接在 Photoshop 内选择对应模型即可进行本地化工作流编辑。

方式 C:通过 CLI / SDK / 自建前端 调用模型 API

  • 若你要做批量或自动化:可使用官方或第三方神马中转API(如 Gemini 的模型名 gemini-2-5-flash-image),把图片上传并附带 prompt 发起请求,接收返回的编辑结果(base64 / URL)。

方式 D:使用神马中转API调用Nano-banana:配置与示例

说明:国内常用的「中转 / 聚合」服务(例如"神马中转 API(api.whatai.cc)等")通常作为代理,把你对 OpenAI / Gemini / 其它模型的调用统一转发处理。下面给出神马中转API可视化和文生图示例

神马中转API可视化操作

神马中转API上方菜单-聊天-Nano Banner画图-输入提示词、上传参考图、生成保存图片

Python文生图示例

Dalle 格式介绍

Generations 通用 (图生图 & 文生图)

用途:用文字或文字+图片来生成一张全新的图片。

kotlin 复制代码
import http.client
import json

conn = http.client.HTTPSConnection("")
payload = json.dumps({
   "prompt": "cat",
   "model": "nano-banana"
})
headers = {
   'Authorization': 'Bearer {{YOUR_API_KEY}}',
   'Content-Type': 'application/json'
}
conn.request("POST", "/v1/images/generations", payload, headers)
res = conn.getresponse()
data = res.read()
print(data.decode("utf-8"))

4. 常见问题与可复用策略

  • 如何保持人物一致性? 上传原始图并在每次请求中把上一次输出也作为参考图;在 prompt 中明确写 "保持面部特征 / 保持发色 / 保持脸型"。

  • 结果不理想怎么办? 逐步微调 prompt、使用 mask 精确控制修改区域、或降低生成风格强度(写"more photorealistic / less stylized")。

  • 速度与成本:通过中转平台可能更便宜/稳定,但要留意延迟与图片大小带来的费用。

  • 法律/道德:避免未经授权修改他人肖像作商业用途,注意隐私与肖像权。官方模型/平台可能会对某些敏感内容进行限制与检测。

5. 快速贴士清单(10 条)

  1. 用短句分层写 prompt。

  2. 首轮先要广,后续再微调细节。

  3. 用参考图胜过长篇风格描述。

  4. 用 mask 精确改动区域。

  5. 保存每次 prompt 便于复现。

  6. 若要一致性,提供多张参考角度的原图。

  7. 避免在 prompt 中加入模棱两可的词。

  8. 使用神马中转API时先做小尺寸测试再放量。

  9. 尊重被摄者权限和版权。

  10. 关注模型输出中的合规信息(如 SynthID)。

相关推荐
Hommy8812 小时前
如何利用剪映小助手实现视频批量剪辑?
aigc·音视频·批量剪辑·剪映
阿杰学AI13 小时前
AI核心知识29——大语言模型之Multimodality(简洁且通俗易懂版)
人工智能·ai·语言模型·自然语言处理·aigc·多模态·多模态大模型
mys551813 小时前
从SEO到GEO:AI搜索如何重塑企业流量新路径?
人工智能·aigc·geo·ai搜索优化·ai引擎优化
小程故事多_8014 小时前
基于LangGraph与Neo4j构建智能体级GraphRAG:打造下一代膳食规划助手
人工智能·aigc·neo4j
溪饱鱼14 小时前
主动与被动AI交互范式
前端·后端·aigc
酷柚易汛智推官15 小时前
从清影2.0看AIGC视频未来:技术、生态与可持续产业价值的竞争逻辑
aigc·音视频·酷柚易汛
阿杰学AI15 小时前
AI核心知识28——大语言模型之Multi-Agent Systems(简洁且通俗易懂版)
人工智能·ai·语言模型·自然语言处理·aigc·agent·多智能体系统
reddingtons15 小时前
LrC AI 降噪:拯救“废片”级高感光,暗光人像重获新生
人工智能·新媒体运营·aigc·传媒·摄影·lightroom·后期
da_vinci_x15 小时前
PS 3D Viewer + AI 生成:灰盒(Greybox)一键变“3A”概念图
人工智能·游戏·数学建模·3d·prompt·aigc·游戏美术