Nano Banana,大香蕉模型小名"纳米香蕉"是 Google/DeepMind 推出的图像生成/编辑子模型(Gemini 2.5 Flash Image 系列的俗称),以强大的一步/迭代图像编辑能力著称,特别擅长在保持主体一致性的前提下对已有照片进行复杂改造(如把真人变成微型摆件、换背景、服装替换、连贯的人物系列编辑等)。
单张/多张图像编辑、one-shot 风格替换、持续迭代保持角色一致、从照片生成风格化3D/半3D小模型/摆件、与 Photoshop等工具集成等。
下面给你一份 详尽的 Nano-banana(即 Google Gemini 的 "Nano Banana / Gemini 2.5 Flash Image")使用教程 ,包含:功能概览、逐步上手教程、Prompt 工程与技巧、10 个「神级玩法」案例(含提示词与步骤)、以及如何通过 神马中转 API 直接使用和配置并调用 Nano-banana(含示例代码)。

1. Nano Banana提示词Prompt工程(实战要点)
成功的图像编辑 prompt 通常要"分层、简洁、指向明确"------建议使用下面结构化模板(可复制粘贴改写),也可以直接复制下一部分提示词的示例直接快速上手:
主体描述(谁 / 物);
动作或姿态(在做什么);
风格/细节(写明风格:写实 / 插画 / 纸雕 / 3D 小摆件);
光照/环境(时间/光源/相机角度);
材质/纹理(例如陶瓷、塑料、金属、迷你木雕);
保留或限制("保留面部表情/不要改变背景中 XX");
输出格式与修饰("高细节、4k、自然阴影、无文字")。
示例(将自拍变成太空宇航服风格):
主体:正面自拍,微笑,年约25岁女性;
动作:面向镜头,头戴透明头盔,身体穿宇航服;
风格:科幻写实,细节丰富;
环境:太空背景,地球在远处,可见星云光晕;
光照:来自右上方的冷色主光,柔和反射;
保留:保留眼睛和面部特征;
输出:可用于头像,裁剪为方形

实用技巧
-
分句写提示,短句比长段更稳定。
-
使用否定短语(avoid / 不要)明确排除元素。
-
用"参考图"或"参考关键词"提高风格一致性(如给出风格参考图或写"像 Studio Ghibli 风格")。
-
若要多次迭代,记录每次 prompt 的改动点,方便复现与微调。
2. 10 个 Nano-banana「神级玩法」与示例提示词(每条含操作步骤与提示词)
下列玩法兼顾创意与可实现性,适用于社交媒体、商业设计、影视概念、个人创作等场景。
微型摆件 / 人像"摆件化"
思路:把真人照片转成桌面小摆件(mini figurine)风格,保留面部特征且做出"塑料/陶瓷"质感。
示例 prompt:
把主体变为一个桌面微型摆件,类似精致陶瓷人偶,头部细节保留,面部光滑有微光,底座木质,尺寸迷你,浅景深相机镜头,柔和环境光,背景为书桌模糊。保持面部表情不变。

步骤:上传清晰正面照 → 指定 mask(身体或背景)→ 选择"塑料/陶瓷"质感 → 迭代调整材质和阴影。
更换多种发型
输入: 需上传一张需要更换发型的人像图片
提示词:
以九宫格的方式生成这个人不同发型的头像

电影海报级别场景重塑
示例 prompt:
把这张城市街拍重制为赛博朋克电影海报风格:霓虹灯、雨滴反射、冷暖对比、宽银幕构图、加深阴影、电影颗粒,保留主体姿态。
步骤:上传原图 → 指定 "风格:赛博朋克" → 要求"宽银幕构图+高对比"。

电影分镜
思路:需上传参考图像
提示:
用这两个角色创作一个令人上瘾的12部分故事,包含12张图像,讲述经典的黑色电影侦探故事。故事关于他们寻找线索并最终发现的失落的宝藏。整个故事充满刺激,有情感的高潮和低谷,以精彩的转折和高潮结尾。不要在图像中包含任何文字或文本,纯粹通过图像本身讲述故事在这张模特图上尝试三种未来感服装:1) 轻质反光外套 2) 高腰结构连衣 3) 层叠功能性战术装。每个输出保持模型脸部与姿态一致。

人物姿势修改
提示:
让图片中的人直视前方

线稿图生成图像
提示:
将图一人物换成图二姿势,专业摄影棚拍摄

物品包装生成
思路:需上传一张物品参考图像和一张包装参考图片
提示:
把图一贴在图二易拉罐上,并放在极简设计的布景中,专业摄影

动漫转真人Coser
输入: 需上传一张插画图像
提示词:
生成一个女孩cosplay这张插画的照片,背景设置在Comiket

生成角色设定
输入: 需上传一张角色参考图像
提示词:
sql
为我生成人物的角色设定(Character Design)
比例设定(不同身高对比、头身比等)
三视图(正面、侧面、背面)
表情设定(Expression Sheet) → 就是你发的那种图
动作设定(Pose Sheet) → 各种常见姿势
服装设定(Costume Design)

OOTD穿搭
输入: 需上传一张人物图片和服装图片
提示词:
选择图1中的人,让他们穿上图2中的所有服装和配饰。在户外拍摄一系列写实的OOTD风格照片,使用自然光线,时尚的街头风格,清晰的全身镜头。保持图1中人物的身份和姿势,但以连贯时尚的方式展示图2中的完整服装和配饰

3. Nano-banana怎么用:四种常见使用方式(含操作步骤)
下面给出最常见的四种上手方式(带具体步骤)------如果你已经有图像,直接按其中一种走即可。
方式 A:在 Google Gemini / AI Studio 中使用(官方渠道)
-
打开 Gemini Image 编辑页面或 AI Studio(gemini.google / AI Studio)。选择 Gemini 2.5 Flash Image / Nano-banana 模型(有时称"Nano-banana"或"gemini-2-5-flash-image")。
-
上传你的原图(单张或多张参考图)。
-
在文本框输入你的编辑提示(prompt)。可分句写清楚要点:主体、动作/表情、风格、背景、光照、材质、要保留/删除的元素。
-
若支持 mask(蒙版),可用画笔圈出希望变动的区域,或标注需保留细节(例如"保留左耳环细节")。
-
生成后使用"迭代"或"变体"功能微调;每轮在 prompt 里加上"更强的光照/更逼真的阴影/保留脸部特征"等指示。
备注:通过官方界面通常能得到最佳一致性与合规性(并可能带有不可见的 SynthID 水印用于标识 AI 生成图像)。
方式 B:通过第三方应用或插件(例如 Photoshop 集成)
- 如果你是设计师,Nano-banana 已被部分工具支持为模型选项,直接在 Photoshop 内选择对应模型即可进行本地化工作流编辑。
方式 C:通过 CLI / SDK / 自建前端 调用模型 API
- 若你要做批量或自动化:可使用官方或第三方神马中转API(如 Gemini 的模型名 gemini-2-5-flash-image),把图片上传并附带 prompt 发起请求,接收返回的编辑结果(base64 / URL)。
方式 D:使用神马中转API调用Nano-banana:配置与示例
说明:国内常用的「中转 / 聚合」服务(例如"神马中转 API(api.whatai.cc)等")通常作为代理,把你对 OpenAI / Gemini / 其它模型的调用统一转发处理。下面给出神马中转API可视化和文生图示例
神马中转API可视化操作
神马中转API上方菜单-聊天-Nano Banner画图-输入提示词、上传参考图、生成保存图片

Python文生图示例
Dalle 格式介绍
Generations 通用 (图生图 & 文生图)
用途:用文字或文字+图片来生成一张全新的图片。
kotlin
import http.client
import json
conn = http.client.HTTPSConnection("")
payload = json.dumps({
"prompt": "cat",
"model": "nano-banana"
})
headers = {
'Authorization': 'Bearer {{YOUR_API_KEY}}',
'Content-Type': 'application/json'
}
conn.request("POST", "/v1/images/generations", payload, headers)
res = conn.getresponse()
data = res.read()
print(data.decode("utf-8"))
4. 常见问题与可复用策略
-
如何保持人物一致性? 上传原始图并在每次请求中把上一次输出也作为参考图;在 prompt 中明确写 "保持面部特征 / 保持发色 / 保持脸型"。
-
结果不理想怎么办? 逐步微调 prompt、使用 mask 精确控制修改区域、或降低生成风格强度(写"more photorealistic / less stylized")。
-
速度与成本:通过中转平台可能更便宜/稳定,但要留意延迟与图片大小带来的费用。
-
法律/道德:避免未经授权修改他人肖像作商业用途,注意隐私与肖像权。官方模型/平台可能会对某些敏感内容进行限制与检测。
5. 快速贴士清单(10 条)
-
用短句分层写 prompt。
-
首轮先要广,后续再微调细节。
-
用参考图胜过长篇风格描述。
-
用 mask 精确改动区域。
-
保存每次 prompt 便于复现。
-
若要一致性,提供多张参考角度的原图。
-
避免在 prompt 中加入模棱两可的词。
-
使用神马中转API时先做小尺寸测试再放量。
-
尊重被摄者权限和版权。
-
关注模型输出中的合规信息(如 SynthID)。