最近爆火的Nano-Banana模型，你会玩了么？

故事始于一个谜团。

前不久，一个名为"nano banana "的神秘Text-to-Image 模型突然登上了LMArena排行榜的首位。

"

LMArena平台允许用户对不同AI模型生成的图片进行盲测对决，非常受欢迎。

它能精准的还原用户的指令，而且在多次编辑后依然能保持主体特征的一致性。一时间，关于这个模型的讨论迅速在网上发酵。

最终，Google的劈柴哥在"X"上以三个香蕉的表情符号确认了，该模型来自谷歌DeepMind团队。

Google的这次的技术营销方式挺有意思，先拿到一个匿名社区去实打实的检验，凭硬实力赢得口碑，任其发酵，最后再官宣。

这种这种"先证明，后宣传"的策略，我认为比直接官宣更有传播力。其它大厂后续对自己的产品足够自信的话，完全可以学一下。

接下来，我会通过一些案例演示，帮助还没体验过的朋友了解下，这个模型的牛逼之处。

如何访问和使用 Nano-Banana？

Nano-Banana集成在Google的生态中，官方的命名其实是Gemini 2.5 Flash Image ，如果你会科学上网，那么可以直接在Gemini APP或Google AI Studio（aistudio.google.com）中使用。

如果因特殊情况，无法科学上网，又想体验，可以使用第三方平台OpenRouter（openrouter.ai/chat?models... ，但没有官方那么稳定。

Nano-Banana的创意玩法

这个周末，我也在不断尝试nano banana的各种玩法及能力边界。

无论是个人娱乐，还是设计提效，甚至是一些专业营销场景，我觉得它都带来巨大的价值。接下来，演示下我尝试过的一些场景，希望能给大家带来一些创作灵感。

1. 智能试衣

上传一张自己的清晰图片，再上传一张想要尝试的服装图片，结合具体的提示词，就能快速看到上身效果。

"

Prompt：将第一张图片中的人，穿上第二张图片里的范思哲上衣，确保贴合自然、光照真实。同时人物图的尺寸不变

2. 时空穿越

上传一张肖像照，并在提示词中详细描绘目标场景的风格和细节，就可以穿越到历史场景或奇幻世界。

"

Prompt：将照片中的小孩置于一个中国古代的书院或庭院里，周围是竹林和亭台。为他设计一个小书生的造型，面部保持一致

3. 室内设计师

拍摄并上传一张家中房间的照片，在不动一砖一瓦的情况下，预览家居空间的改造效果。我只是做了简单尝试，在家装领域应该大有可为。

"

Prompt：在这张客厅照片中，移除面前的两个小桌子，在客厅中间摆放一个麻将桌.

4. 老照片修复

可以为褪色的黑白老照片上色，或修复照片上的瑕疵。

"

Prompt：为这张黑白照片进行上色，使其色彩看起来自然且符合时代特征。同时，修复图片上的划痕。

5. 创作手办

可以将一张真人照片转化为一个带有完整包装和制作场景的3D风格收藏级手办。

"

Prompt：将这张照片变成一个角色手办。在它后面，放置一个印有该角色形象的包装盒，以及一台显示着Blender建模过程的电脑。在包装盒前面，添加一个圆形的塑料底座，让手办站立在上面。

6. 无限产品写真

上传一张背景干净的产品图后，可以为这个产品生成无数个生活化或创意场景图，极大节省拍摄成本。

"

Prompt：将这个手提包放置在一辆豪华轿车的副驾驶座位上，有柔和的午后阳光从车窗照入。添加逼真的阴影。

7. 批量产生广告素材

和第6点的尝试类似，比较适合批量生成广告图。提供一张基础图片，结合具体的提示词，在极短时间内生成一系列视觉风格统一但元素各异的广告素材，用于测试不同类型的广告效果测试。

"

Prompt：为这张图片创建三个用于广告的版本。版本一：将背景更换为繁华的城市街道。版本二：将背景更换为宁静的日落海滩。版本三：将模特的服装更换为一套专业的商务西装。

8. 周边效果素材

可以上传一个自己的设计图，然后为T恤、马克杯、海报等周边商品快速生成高质量的展示图。我用了一个哪吒的设计图来测试。

"

Prompt：生成一张样机图，展示这个图形设计被印在一件由模特穿着的黑色T恤上。同时，也展示同样的设计印在一个白色的陶瓷马克杯上的效果。

9. 互动白板

可以上传一张自己的手绘图，然后将手绘的草图或思维导图，快速转化为清晰、专业的图表，一般用于教学或商业演示。但目前的问题是模型对中文的支持还是很差。

"

Prompt：读取这张手绘的水循环示意图，并将其重新绘制成一幅带有清晰标签和箭头的、外观整洁专业、写实风格的教学图。

10. 多张照片融合

可以将多张独立图片中的不同元素（人物、物品、背景等）无缝地融合到一个全新的、合乎逻辑的场景中。

"

Prompt：图中的男生正靠在一辆红色保时捷旁摆姿势。他穿着以下物品，戴着墨镜，场景背景是浅灰色，他旁边坐着一只黑色的哈巴狗。面图特征必须和图中人像完全一致

11. 生成不同角度的效果图

仅凭一张正面产品图，可以生成该产品的多个不同角度的视图。

"

Prompt：使用这张单一的产品图片，生成两张新的图片：一张是3/4侧面角度，另一张是高角度俯瞰视图。在生成过程中保持产品的设计和纹理不变。

12. 制作AR效果

在真实的场景照片上，为某个具体的物体模拟出增强现实（AR）的信息叠加效果。

"

Prompt：你是一个基于地理位置的AR体验生成器。在这张东京铁塔的图片中，高亮其主体结构，并用一个AR风格的浮动信息卡为它添加英文注释，说明其建造的关键信息。

经过一系列测试，很明显可以感受到，这个模型的能力确实很强（有时候一次生成效果不好，可以多重试几次，网上大家都调侃为抽卡）。

尤其是在一些营销广告场景，以前是先有想法，然后投入巨资进行拍摄或设计，最终产出少数几个成品用于发布。当AI模型的能力越来越强，以后营销人员和设计师可以瞬间生成数十种视觉方案的原型，极大提升了生产效率。

怎么用好Nano-Banana

要充分发挥面模型的潜力，如何写好提示词很关键。我总结了一些技巧，不一定对，大家可以参考。

尽量将多个编辑指令合并：将多个编辑指令合并到一个提示词中，可以更好的提升效率。与其分三步告诉AI"换背景"、"改衣服颜色"、"加个帽子"，不如一次性说清楚："把背景换成雪山，衣服改成红色，并为他戴上一顶黑色的帽子"。这不仅节省时间和成本，通常也能让AI更好地理解整体意图，生成更协调的结果。
要加保护性指令：明确告诉AI哪些元素是不需要改变的。在提示词中加入"保持面部不变"、"保留织物纹理"或"维持原始背景"等指令，可以像给AI画出"安全区"，有效减少不必要的修改，确保核心元素的稳定。
学会培养摄影师思维：使用更专业、更具体的摄影术语来代替模糊的描述，能够获得更精细的控制。少使用"让它好看点"这样的说法，尝试使用"使用柔和的暖光、哑光质感、短阴影"等摄影语言。如果你很精通摄影，甚至可以指定相机参数，例如"光圈1.8，ISO 100，快门速度1/250"，以追求特定的视觉效果。
多轮微调：Nano-Banana模型的一致性很强，如果第一轮生成的结果不太满足要求，可以通过对轮对话逐步将细节调整完美。

结语

看完以上的演示，大家感受如何。我演示的只是它能力的冰山一角，它真正的革命性在于，极大地普及了高级创意编辑的能力。这意味着将过去需要数年学习才能掌握的专业技能，转化为几句简单的自然语言指令，为咱们普通用户打开了创意世界的大门。