模块 3:Nano Banana(AI 图像生成)
3.0 设置与下载

**完成时间:**5 分钟
什么是 Nano Banana?
Nano Banana 教你使用 Gemini 3 Pro Preview 生成专业图像。这是一个 Claude Code 课程------你将学习构建一个完整的图像生成工作流。
-
运行你的生成------直接从终端执行图像请求
-
批量处理多个图像------并行生成变体和迭代
-
管理你的文件------组织输出、智能命名、跟踪版本
-
构建你的风格库------创建和维护可重用的风格定义
-
与你一起迭代------对话式地完善提示、调整参数
你将学到
-
3.1.1: 欢迎与首次生成------设置 API 密钥并生成你的第一张图像
-
3.1.2: 理解基础------参数、宽高比、分辨率、迭代
-
3.1.3: 一致性与风格------提示的黄金规则、参考图像、变体
-
3.1.4: 构建风格数据库------创建可重用的风格库
-
3.2.1: 用户与产品视觉------人物画像、旅程地图、线框图、模型
-
3.2.2: 策略与架构视觉------图表、矩阵、路线图
-
3.2.3: 营销与发布资产------应用商店图形、广告、公告
3.1.1 欢迎与首次生成
**完成时间:**10 分钟
什么是 Gemini 3 Pro?
Gemini 3 Pro 是 Google 最先进的图像生成模型。它可以:
-
从文本描述生成逼真图像
-
转换参考照片同时保持身份
-
添加准确的文本覆盖
-
在多个生成中创建一致的角色
-
理解和复制复杂的视觉风格
设置 API 密钥
-
步骤 1:从 Google AI Studio 获取密钥(aistudio.google.com)
-
步骤 2:设置计费(约 0.10/张图像,整个课程不到 5)
-
步骤 3:告诉 Claude 你的 API 密钥,它会设置一切
3.1.2 理解基础
**完成时间:**15 分钟
generate() 函数
| 参数 | 控制什么 | 默认 |
|---|---|---|
| prompt | 你对图像的描述 | 必需 |
| reference_images | 用作视觉输入的照片 | 无 |
| aspect_ratio | 输出图像的形状 | 1:1 |
| resolution | 输出的大小/质量 | 1K |
宽高比
| 比例 | 形状 | 最适合 |
|---|---|---|
| 1:1 | 正方形 | 个人资料照、Instagram 帖子 |
| 16:9 | 宽横幅 | 演示文稿、YouTube 缩略图 |
| 9:16 | 高竖版 | Instagram/TikTok 故事 |
| 4:5 | 高矩形 | Instagram 动态帖子 |
| 3:2 | 经典照片 | 传统摄影比例 |
| 21:9 | 超宽 | 电影感、横幅 |
分辨率
| 分辨率 | 尺寸 | 生成时间 | 最适合 |
|---|---|---|---|
| 1K | 1024px | 约 20 秒 | 草稿、迭代 |
| 2K | 2048px | 约 30 秒 | 最终输出 |
| 4K | 4096px | 约 45 秒 | 打印 |
**分辨率策略:**迭代时使用 1K,最终版本使用 2K,仅在打印时使用 4K。
迭代:核心工作流
迭代是图像生成中最重要的概念。Gemini 是一个思考模型------它在对话中保持上下文。当你说让它更蓝时,它知道它指的是什么。
3.1.3 一致性与风格
**完成时间:**20 分钟
提示的黄金规则
-
规则 1:编辑,不要重新生成------如果图像 80% 正确,要求具体更改而不是重新开始。
-
规则 2:使用自然语言和完整句子------像给人类艺术家简报一样与 Gemini 对话。
-
规则 3:具体和描述性------定义主体、设置、光照、情绪、纹理和材料。
-
规则 4:提供上下文------告诉 Gemini 为什么或为谁,以便它做出更聪明的创意决策。
参考图像
| 类型 | 目的 | 示例 |
|---|---|---|
| 风格参考 | 捕捉视觉美学 | 着陆页设计、艺术风格 |
| 主体参考 | 保持角色一致性 | 人物照片、产品照 |
| 构图参考 | 指导布局和框架 | 线框图、截图 |
网格:一张图像中的多个视图
Create a 3x3 grid showing [subject] in 9 different poses
变体:探索方向
Generate 3 variants of [concept] with different creative interpretations
**变体 vs 迭代:**变体探索不同方向,迭代完善一个方向。最佳实践:用变体找到方向,然后用迭代完善它。
3.1.4 构建风格数据库
**完成时间:**20 分钟
元技能
大多数人将 AI 图像工具作为一次性新奇事物使用。高级用户生成、保存获胜的提示、跨项目重用、随时间构建库。
三种增长库的方式
-
方法 1:随做随存------每当创建喜欢的东西时保存
-
方法 2:从网上收集------找到好的提示,测试后保存
-
方法 3:从任何图像提取------看到喜欢的图像,提取其风格为文本
风格库分类
| 类别 | 包含内容 |
|---|---|
| Framework | 2x2 矩阵、金字塔、韦恩图 |
| Flow | 流程图、旅程地图 |
| Architecture | 系统图、组织结构图 |
| Mockup | 线框图、设备框架、UI 概念 |
| Persona | 肖像、生活方式照、头像 |
| Marketing | 广告、公告、社交图形 |
| Artistic | 插画、摄影风格、复古外观 |
复利效应
- 第 1 周:5 个风格 | 第 1 月:15 个风格 | 第 3 月:30+ 个风格 | 第 1 年:50+ 个风格
3.2.1 用户与产品视觉
**完成时间:**25 分钟
概述
模块 3.2.1 将你的图像生成技能应用于真实 PM 交付物。
人物画像

人物画像为你的目标用户赋予面孔。它们使抽象的用户细分感觉真实。
旅程地图

旅程地图可视化用户随时间的体验------步骤、触点、痛点和情绪。
设备模型

设备模型将你的线框图或截图放入手机/笔记本电脑框架中。
生活场景图

生活场景图展示你的产品在真实世界中的使用。
3.2.2 策略与架构视觉
**完成时间:**20 分钟
系统架构图

系统架构图显示组件如何连接------服务、数据库、API、外部集成。
优先级矩阵

| 象限 | 含义 | 行动 |
|---|---|---|
| 快速胜利 | 高影响、低努力 | 首先做 |
| 重大项目 | 高影响、高努力 | 仔细规划 |
| 填充项 | 低影响、低努力 | 有时间时做 |
| 避免 | 低影响、高努力 | 不做 |
产品路线图

产品路线图显示随时间计划的 work------通常按季度或月份。
3.2.3 营销与发布资产
**完成时间:**20 分钟
概述
模块 3.2.3 用营销和发布资产完成你的产品视觉工具包。
应用商店功能图形
| 平台 | 尺寸 | 备注 |
|---|---|---|
| App Store | 1024x1024 | 应用图标和截图 |
| Play Store | 1024x500 | 宽横幅格式 |
社交广告创意
| 平台 | 推荐尺寸 | 备注 |
|---|---|---|
| 1200x627, 1080x1080 | 专业 B2B 受众 | |
| Twitter/X | 1200x675, 1080x1080 | 快速互动 |
| Facebook/Instagram | 1080x1080, 1080x1350 | 视觉优先平台 |
广告创意模式
-
前后对比------问题状态到解决方案状态
-
产品主图------设备/界面居中
-
生活方式------用户在上下文中
-
数据/统计------带视觉冲击力的数字
-
证言------带人物的引用
发布公告图形
-
令人兴奋------动态模糊、动态角度、明亮色彩
-
高端------干净、极简、精致光照
-
创新------未来感、技术前沿、大胆
-
值得信赖------稳定、专业、令人安心
完整发布资产包
**总时间:**30-45 分钟完成完整发布包。