产品经理的 Claude Code 免费教程——模块 3:Nano Banana(AI 图像生成)

模块 3:Nano Banana(AI 图像生成)

3.0 设置与下载

**完成时间:**5 分钟

什么是 Nano Banana?

Nano Banana 教你使用 Gemini 3 Pro Preview 生成专业图像。这是一个 Claude Code 课程------你将学习构建一个完整的图像生成工作流。

  • 运行你的生成------直接从终端执行图像请求

  • 批量处理多个图像------并行生成变体和迭代

  • 管理你的文件------组织输出、智能命名、跟踪版本

  • 构建你的风格库------创建和维护可重用的风格定义

  • 与你一起迭代------对话式地完善提示、调整参数

你将学到

  • 3.1.1: 欢迎与首次生成------设置 API 密钥并生成你的第一张图像

  • 3.1.2: 理解基础------参数、宽高比、分辨率、迭代

  • 3.1.3: 一致性与风格------提示的黄金规则、参考图像、变体

  • 3.1.4: 构建风格数据库------创建可重用的风格库

  • 3.2.1: 用户与产品视觉------人物画像、旅程地图、线框图、模型

  • 3.2.2: 策略与架构视觉------图表、矩阵、路线图

  • 3.2.3: 营销与发布资产------应用商店图形、广告、公告

3.1.1 欢迎与首次生成

**完成时间:**10 分钟

什么是 Gemini 3 Pro?

Gemini 3 Pro 是 Google 最先进的图像生成模型。它可以:

  • 从文本描述生成逼真图像

  • 转换参考照片同时保持身份

  • 添加准确的文本覆盖

  • 在多个生成中创建一致的角色

  • 理解和复制复杂的视觉风格

设置 API 密钥

  • 步骤 1:从 Google AI Studio 获取密钥(aistudio.google.com

  • 步骤 2:设置计费(约 0.10/张图像,整个课程不到 5)

  • 步骤 3:告诉 Claude 你的 API 密钥,它会设置一切

3.1.2 理解基础

**完成时间:**15 分钟

generate() 函数

参数 控制什么 默认
prompt 你对图像的描述 必需
reference_images 用作视觉输入的照片
aspect_ratio 输出图像的形状 1:1
resolution 输出的大小/质量 1K

宽高比

比例 形状 最适合
1:1 正方形 个人资料照、Instagram 帖子
16:9 宽横幅 演示文稿、YouTube 缩略图
9:16 高竖版 Instagram/TikTok 故事
4:5 高矩形 Instagram 动态帖子
3:2 经典照片 传统摄影比例
21:9 超宽 电影感、横幅

分辨率

分辨率 尺寸 生成时间 最适合
1K 1024px 约 20 秒 草稿、迭代
2K 2048px 约 30 秒 最终输出
4K 4096px 约 45 秒 打印

**分辨率策略:**迭代时使用 1K,最终版本使用 2K,仅在打印时使用 4K。

迭代:核心工作流

迭代是图像生成中最重要的概念。Gemini 是一个思考模型------它在对话中保持上下文。当你说让它更蓝时,它知道它指的是什么。

3.1.3 一致性与风格

**完成时间:**20 分钟

提示的黄金规则

  • 规则 1:编辑,不要重新生成------如果图像 80% 正确,要求具体更改而不是重新开始。

  • 规则 2:使用自然语言和完整句子------像给人类艺术家简报一样与 Gemini 对话。

  • 规则 3:具体和描述性------定义主体、设置、光照、情绪、纹理和材料。

  • 规则 4:提供上下文------告诉 Gemini 为什么或为谁,以便它做出更聪明的创意决策。

参考图像

类型 目的 示例
风格参考 捕捉视觉美学 着陆页设计、艺术风格
主体参考 保持角色一致性 人物照片、产品照
构图参考 指导布局和框架 线框图、截图

网格:一张图像中的多个视图

复制代码
Create a 3x3 grid showing [subject] in 9 different poses

变体:探索方向

复制代码
Generate 3 variants of [concept] with different creative interpretations

**变体 vs 迭代:**变体探索不同方向,迭代完善一个方向。最佳实践:用变体找到方向,然后用迭代完善它。

3.1.4 构建风格数据库

**完成时间:**20 分钟

元技能

大多数人将 AI 图像工具作为一次性新奇事物使用。高级用户生成、保存获胜的提示、跨项目重用、随时间构建库。

三种增长库的方式

  • 方法 1:随做随存------每当创建喜欢的东西时保存

  • 方法 2:从网上收集------找到好的提示,测试后保存

  • 方法 3:从任何图像提取------看到喜欢的图像,提取其风格为文本

风格库分类

类别 包含内容
Framework 2x2 矩阵、金字塔、韦恩图
Flow 流程图、旅程地图
Architecture 系统图、组织结构图
Mockup 线框图、设备框架、UI 概念
Persona 肖像、生活方式照、头像
Marketing 广告、公告、社交图形
Artistic 插画、摄影风格、复古外观

复利效应

  • 第 1 周:5 个风格 | 第 1 月:15 个风格 | 第 3 月:30+ 个风格 | 第 1 年:50+ 个风格

3.2.1 用户与产品视觉

**完成时间:**25 分钟

概述

模块 3.2.1 将你的图像生成技能应用于真实 PM 交付物。

人物画像

人物画像为你的目标用户赋予面孔。它们使抽象的用户细分感觉真实。

旅程地图

旅程地图可视化用户随时间的体验------步骤、触点、痛点和情绪。

设备模型

设备模型将你的线框图或截图放入手机/笔记本电脑框架中。

生活场景图

生活场景图展示你的产品在真实世界中的使用。

3.2.2 策略与架构视觉

**完成时间:**20 分钟

系统架构图

系统架构图显示组件如何连接------服务、数据库、API、外部集成。

优先级矩阵

象限 含义 行动
快速胜利 高影响、低努力 首先做
重大项目 高影响、高努力 仔细规划
填充项 低影响、低努力 有时间时做
避免 低影响、高努力 不做

产品路线图

产品路线图显示随时间计划的 work------通常按季度或月份。

3.2.3 营销与发布资产

**完成时间:**20 分钟

概述

模块 3.2.3 用营销和发布资产完成你的产品视觉工具包。

应用商店功能图形

平台 尺寸 备注
App Store 1024x1024 应用图标和截图
Play Store 1024x500 宽横幅格式

社交广告创意

平台 推荐尺寸 备注
LinkedIn 1200x627, 1080x1080 专业 B2B 受众
Twitter/X 1200x675, 1080x1080 快速互动
Facebook/Instagram 1080x1080, 1080x1350 视觉优先平台

广告创意模式

  • 前后对比------问题状态到解决方案状态

  • 产品主图------设备/界面居中

  • 生活方式------用户在上下文中

  • 数据/统计------带视觉冲击力的数字

  • 证言------带人物的引用

发布公告图形

  • 令人兴奋------动态模糊、动态角度、明亮色彩

  • 高端------干净、极简、精致光照

  • 创新------未来感、技术前沿、大胆

  • 值得信赖------稳定、专业、令人安心

完整发布资产包

**总时间:**30-45 分钟完成完整发布包。

相关推荐
却道天凉_好个秋2 小时前
pytorch(一):张量
人工智能·pytorch·python·深度学习
搞科研的小刘选手2 小时前
【高届数人文社科会议】第十二届人文学科和社会科学研究国际学术会议(ICHSSR 2026)
大数据·人工智能·电子信息·电子工程·学术会议·信息工程·电路工程
0xDevNull2 小时前
现代AI系统架构全景解析
人工智能·系统架构
华清远见IT开放实验室2 小时前
AI 算法核心知识清单(深度实战版1)
人工智能·python·深度学习·学习·算法·机器学习·ai
亚远景aspice2 小时前
亚远景推出国内首款汽车研发合规AI全栈产品 填补和引领行业AI应用
大数据·人工智能
大囚长2 小时前
大模型知识与逻辑推理能力的关系
人工智能
世优科技虚拟人2 小时前
重庆合川发布陶行知AI数字人,世优科技提供数字人全栈技术支持
人工智能·科技·数字人·智能交互
云烟成雨TD2 小时前
Spring AI 1.x 系列【27】Chat Memory API:让 LLM 拥有上下文记忆能力
java·人工智能·spring
kimi-2222 小时前
如何让大语言模型稳定输出 JSON 的三层防御体系
人工智能·语言模型·json