产品经理的 Claude Code 免费教程——模块 3:Nano Banana(AI 图像生成)

模块 3:Nano Banana(AI 图像生成)

3.0 设置与下载

**完成时间:**5 分钟

什么是 Nano Banana?

Nano Banana 教你使用 Gemini 3 Pro Preview 生成专业图像。这是一个 Claude Code 课程------你将学习构建一个完整的图像生成工作流。

  • 运行你的生成------直接从终端执行图像请求

  • 批量处理多个图像------并行生成变体和迭代

  • 管理你的文件------组织输出、智能命名、跟踪版本

  • 构建你的风格库------创建和维护可重用的风格定义

  • 与你一起迭代------对话式地完善提示、调整参数

你将学到

  • 3.1.1: 欢迎与首次生成------设置 API 密钥并生成你的第一张图像

  • 3.1.2: 理解基础------参数、宽高比、分辨率、迭代

  • 3.1.3: 一致性与风格------提示的黄金规则、参考图像、变体

  • 3.1.4: 构建风格数据库------创建可重用的风格库

  • 3.2.1: 用户与产品视觉------人物画像、旅程地图、线框图、模型

  • 3.2.2: 策略与架构视觉------图表、矩阵、路线图

  • 3.2.3: 营销与发布资产------应用商店图形、广告、公告

3.1.1 欢迎与首次生成

**完成时间:**10 分钟

什么是 Gemini 3 Pro?

Gemini 3 Pro 是 Google 最先进的图像生成模型。它可以:

  • 从文本描述生成逼真图像

  • 转换参考照片同时保持身份

  • 添加准确的文本覆盖

  • 在多个生成中创建一致的角色

  • 理解和复制复杂的视觉风格

设置 API 密钥

  • 步骤 1:从 Google AI Studio 获取密钥(aistudio.google.com

  • 步骤 2:设置计费(约 0.10/张图像,整个课程不到 5)

  • 步骤 3:告诉 Claude 你的 API 密钥,它会设置一切

3.1.2 理解基础

**完成时间:**15 分钟

generate() 函数

参数 控制什么 默认
prompt 你对图像的描述 必需
reference_images 用作视觉输入的照片
aspect_ratio 输出图像的形状 1:1
resolution 输出的大小/质量 1K

宽高比

比例 形状 最适合
1:1 正方形 个人资料照、Instagram 帖子
16:9 宽横幅 演示文稿、YouTube 缩略图
9:16 高竖版 Instagram/TikTok 故事
4:5 高矩形 Instagram 动态帖子
3:2 经典照片 传统摄影比例
21:9 超宽 电影感、横幅

分辨率

分辨率 尺寸 生成时间 最适合
1K 1024px 约 20 秒 草稿、迭代
2K 2048px 约 30 秒 最终输出
4K 4096px 约 45 秒 打印

**分辨率策略:**迭代时使用 1K,最终版本使用 2K,仅在打印时使用 4K。

迭代:核心工作流

迭代是图像生成中最重要的概念。Gemini 是一个思考模型------它在对话中保持上下文。当你说让它更蓝时,它知道它指的是什么。

3.1.3 一致性与风格

**完成时间:**20 分钟

提示的黄金规则

  • 规则 1:编辑,不要重新生成------如果图像 80% 正确,要求具体更改而不是重新开始。

  • 规则 2:使用自然语言和完整句子------像给人类艺术家简报一样与 Gemini 对话。

  • 规则 3:具体和描述性------定义主体、设置、光照、情绪、纹理和材料。

  • 规则 4:提供上下文------告诉 Gemini 为什么或为谁,以便它做出更聪明的创意决策。

参考图像

类型 目的 示例
风格参考 捕捉视觉美学 着陆页设计、艺术风格
主体参考 保持角色一致性 人物照片、产品照
构图参考 指导布局和框架 线框图、截图

网格:一张图像中的多个视图

复制代码
Create a 3x3 grid showing [subject] in 9 different poses

变体:探索方向

复制代码
Generate 3 variants of [concept] with different creative interpretations

**变体 vs 迭代:**变体探索不同方向,迭代完善一个方向。最佳实践:用变体找到方向,然后用迭代完善它。

3.1.4 构建风格数据库

**完成时间:**20 分钟

元技能

大多数人将 AI 图像工具作为一次性新奇事物使用。高级用户生成、保存获胜的提示、跨项目重用、随时间构建库。

三种增长库的方式

  • 方法 1:随做随存------每当创建喜欢的东西时保存

  • 方法 2:从网上收集------找到好的提示,测试后保存

  • 方法 3:从任何图像提取------看到喜欢的图像,提取其风格为文本

风格库分类

类别 包含内容
Framework 2x2 矩阵、金字塔、韦恩图
Flow 流程图、旅程地图
Architecture 系统图、组织结构图
Mockup 线框图、设备框架、UI 概念
Persona 肖像、生活方式照、头像
Marketing 广告、公告、社交图形
Artistic 插画、摄影风格、复古外观

复利效应

  • 第 1 周:5 个风格 | 第 1 月:15 个风格 | 第 3 月:30+ 个风格 | 第 1 年:50+ 个风格

3.2.1 用户与产品视觉

**完成时间:**25 分钟

概述

模块 3.2.1 将你的图像生成技能应用于真实 PM 交付物。

人物画像

人物画像为你的目标用户赋予面孔。它们使抽象的用户细分感觉真实。

旅程地图

旅程地图可视化用户随时间的体验------步骤、触点、痛点和情绪。

设备模型

设备模型将你的线框图或截图放入手机/笔记本电脑框架中。

生活场景图

生活场景图展示你的产品在真实世界中的使用。

3.2.2 策略与架构视觉

**完成时间:**20 分钟

系统架构图

系统架构图显示组件如何连接------服务、数据库、API、外部集成。

优先级矩阵

象限 含义 行动
快速胜利 高影响、低努力 首先做
重大项目 高影响、高努力 仔细规划
填充项 低影响、低努力 有时间时做
避免 低影响、高努力 不做

产品路线图

产品路线图显示随时间计划的 work------通常按季度或月份。

3.2.3 营销与发布资产

**完成时间:**20 分钟

概述

模块 3.2.3 用营销和发布资产完成你的产品视觉工具包。

应用商店功能图形

平台 尺寸 备注
App Store 1024x1024 应用图标和截图
Play Store 1024x500 宽横幅格式

社交广告创意

平台 推荐尺寸 备注
LinkedIn 1200x627, 1080x1080 专业 B2B 受众
Twitter/X 1200x675, 1080x1080 快速互动
Facebook/Instagram 1080x1080, 1080x1350 视觉优先平台

广告创意模式

  • 前后对比------问题状态到解决方案状态

  • 产品主图------设备/界面居中

  • 生活方式------用户在上下文中

  • 数据/统计------带视觉冲击力的数字

  • 证言------带人物的引用

发布公告图形

  • 令人兴奋------动态模糊、动态角度、明亮色彩

  • 高端------干净、极简、精致光照

  • 创新------未来感、技术前沿、大胆

  • 值得信赖------稳定、专业、令人安心

完整发布资产包

**总时间:**30-45 分钟完成完整发布包。

相关推荐
科研前沿13 小时前
2026 空间智能革命:镜像视界无感定位 × 数字孪生,重构无感定位空间感知体系
人工智能
学弟14 小时前
【快捷】通过指定CPU的分配解决A100服务器上多训练任务核心争抢导致的训练速度慢的问题
人工智能·深度学习·机器学习
水如烟15 小时前
孤能子视角:“Introspection Adapter(IA)“,“代偿哨兵翻译层“
人工智能
AI_小站21 小时前
6个GitHub爆火的免费大模型教程,助你快速进阶AI编程
人工智能·langchain·github·知识图谱·agent·llama·rag
xindoo21 小时前
GitHub Trending霸榜!深度解析AI Coding辅助神器 Superpowers
人工智能·github
时间之里21 小时前
【深度学习】:RF-DETR与yolo对比
人工智能·深度学习·yolo
北京阿法龙科技有限公司21 小时前
数智化升级:AR 智能眼镜驱动工业运维效能革新
人工智能
风落无尘21 小时前
《智能重生:从垃圾堆到AI工程师》——第二章 概率与生存
大数据·人工智能
j_xxx404_21 小时前
Linux:静态链接与动态链接深度解析
linux·运维·服务器·c++·人工智能
收获不止数据库21 小时前
达梦9发布会归来:AI 时代,我们需要一款什么样的数据库?
数据库·人工智能·ai·语言模型·数据分析