使用 Claude Code Skills 模拟的视频生成流程

本文档模拟从创建项目到完成的完整流程,包括火山引擎流程和 Sora 流程。

场景:创建一个关于友谊的绘本视频

第一阶段:项目创建与创意阶段

用户输入
复制代码
创建一个关于友谊的绘本视频
pbvc-router 响应
erlang 复制代码
✅ 项目已创建:2025-01-11-friendship
📁 项目目录:projects/2025-01-11-friendship/

准备开始创意阶段...
创建的目录结构
lua 复制代码
projects/2025-01-11-friendship/
├── metadata.json
├── creative/
├── production/
├── assets/
│   ├── images/
│   └── videos/
└── output/
metadata.json 初始状态
json 复制代码
{
  "project_id": "2025-01-11-friendship",
  "created_at": "2025-01-11T10:00:00Z",
  "last_updated": "2025-01-11T10:00:00Z",
  "status": "creative",
  "progress": {
    "creative": "in_progress",
    "production": "pending",
    "generation": "pending",
    "archiving": "pending"
  },
  "current_stage": "theme_selection",
  "user_input": "创建一个关于友谊的绘本视频",
  "theme_keyword": "友谊",
  "can_resume": true
}

步骤 1:主题推荐(theme-recommender)
markdown 复制代码
现在开始创意阶段的第一步:主题推荐

基于关键词"友谊",为你推荐以下主题:

1. 友谊的力量
   核心信息:真正的朋友会在你需要时陪伴你
   故事角度:孤独的新朋友被接纳的过程
   适合场景:搬家、转学、社交焦虑

2. 分享的快乐
   核心信息:分享让友谊更深厚
   故事角度:学会分享玩具/食物的过程

3. 包容与接纳
   核心信息:尊重差异,接纳不同
   故事角度:不同性格/外表的角色成为朋友

请选择一个主题(1/2/3),或告诉我你自己的想法:
用户选择
复制代码
1
theme.json 输出
json 复制代码
{
  "theme_id": "friendship_power",
  "theme_name": "友谊的力量",
  "core_message": "真正的朋友会在你需要时陪伴你",
  "story_angle": "孤独的新朋友被接纳的过程",
  "target_audience": "3-6岁儿童",
  "emotional_keywords": ["孤独", "害羞", "勇气", "温暖", "接纳"],
  "selected_at": "2025-01-11T10:05:00Z"
}

步骤 2:风格选择(style-selector)
markdown 复制代码
主题已确定,现在选择视觉风格

为"友谊的力量"推荐的风格:

1. 温暖水彩风格 ⭐️ 推荐
   特点:柔和色调,梦幻氛围
   适合:情感类故事,营造温馨感

2. 明亮卡通风格
   特点:鲜艳色彩,活泼动感
   适合:欢快的故事,充满活力

3. 淡雅手绘风格
   特点:简约线条,自然质朴
   适合:安静的故事,舒缓节奏

请选择风格(1/2/3):
用户选择
复制代码
1
style.json 输出
json 复制代码
{
  "style_id": "warm_watercolor",
  "style_name": "温暖水彩风格",
  "visual_characteristics": {
    "art_style": "水彩画",
    "color_tone": "温暖柔和",
    "color_palette": ["#FFE5B4", "#90EE90", "#87CEEB", "#FFB6C1"],
    "texture": "柔和模糊的边缘",
    "lighting": "柔和自然光"
  },
  "mood": "温馨、梦幻、治愈",
  "technical_tags": [
    "watercolor",
    "soft colors",
    "warm tones",
    "gentle lighting",
    "dreamy atmosphere"
  ],
  "selected_at": "2025-01-11T10:08:00Z"
}

步骤 3:剧情编写(story-writer)
复制代码
主题和风格已确定,现在开始编写剧情

我会通过几个问题来了解你的故事需求:

问题 1/5:主角的基本设定
建议:小白兔莉莉,刚搬到新家,性格害羞但好奇

这个设定可以吗?或者你有其他想法?
用户回答
复制代码
可以

问题 2/5:故事开始的情境
建议:莉莉站在新家门口,听到远处树林传来欢快的笑声,想去看看但又害怕

可以吗?
用户回答
复制代码
可以

问题 3/5:冲突或挑战
建议:莉莉很想交朋友,但害怕被拒绝,在树林边缘犹豫不决

可以吗?
用户回答
复制代码
可以

问题 4/5:转折点
建议:一只松鼠的玩具球滚到莉莉脚边,莉莉帮忙捡起并递回去

可以吗?
用户回答
复制代码
可以

问题 5/5:结局
建议:小动物们邀请莉莉一起玩,莉莉感受到友谊的温暖,露出开心的笑容

可以吗?
用户回答
复制代码
可以
story.md 输出
markdown 复制代码
# 故事:莉莉的新朋友

**主题:** 友谊的力量
**风格:** 温暖水彩
**目标受众:** 3-6岁儿童
**核心信息:** 真正的朋友会在你需要时陪伴你

---

### 场景 1:新家门口
小白兔莉莉站在新家门口,好奇地看着远处的树林。她有着白色柔软的毛发,头上戴着一个粉色的蝴蝶结,大大的蓝色眼睛充满了好奇。

远处传来阵阵欢快的笑声,莉莉的耳朵竖了起来。"那是什么声音?"她想。

---

### 场景 2:远处的欢笑
莉莉听到远处树林里传来小动物们的欢笑声,她的心跳加快了。"我好想去看看...但是,他们会喜欢我吗?"

---

### 场景 3:犹豫的脚步
莉莉慢慢走向树林,但在树林边缘停了下来。她看到几只小松鼠在玩耍,一只小狐狸在追蝴蝶,还有一只小鹿在吃草。

"他们看起来好开心...但我该怎么和他们打招呼呢?"莉莉的耳朵垂了下来。

---

### 场景 4:第一次尝试
莉莉深吸一口气,试着向前迈了一步,但又停住了。"如果他们不喜欢我怎么办?"她的心里充满了担忧。

---

### 场景 5:藏在树后
莉莉躲到一棵大树后面,偷偷地看着其他小动物玩耍。她既羡慕又害怕。

---

### 场景 6:意外的机会
突然,一个红色的小球滚到了莉莉的脚边。一只小松鼠追着球跑过来,看到了莉莉。

"你好!"小松鼠友好地说,"你能帮我把球递给我吗?"

---

### 场景 7:莉莉的帮助
莉莉小心翼翼地捡起球,递给了小松鼠。"谢谢你!"小松鼠开心地说。

---

### 场景 8:被注意到
其他小动物也注意到了莉莉。小狐狸跑过来说:"你是新搬来的吗?欢迎!"

---

### 场景 9:温暖的邀请
"你想和我们一起玩吗?"小松鼠邀请道。莉莉的眼睛亮了起来,但还是有点害羞。

---

### 场景 10:尝试接触
莉莉点了点头,小声说:"好的...我叫莉莉。"

小狐狸高兴地说:"太好了!我叫小火,这是松松,那是小鹿。"

---

### 场景 11:融入群体
小动物们围着莉莉,热情地介绍他们正在玩的游戏。莉莉感到一股暖流涌上心头。

---

### 场景 12:快乐的结局
莉莉和新朋友们一起玩耍,她的脸上露出了开心的笑容。阳光透过树叶洒下来,照在他们身上,温暖又美好。

"原来交朋友并不难!"莉莉想,"真正的朋友会接纳你,陪伴你。"

---

**故事主题呼应:** 莉莉通过克服害羞,体验到了友谊的温暖。真正的朋友会在你需要时陪伴你,给你勇气和力量。

**情感弧线:** 好奇但害羞 → 犹豫不决 → 鼓起勇气 → 尝试接近 → 感到温暖 → 建立友谊 → 快乐满足

**总场景数:** 12 个
**预计时长:** 2-3 分钟

创意阶段检查点
css 复制代码
✅ 创意阶段完成!

已确认:
- 主题:友谊的力量
- 风格:温暖水彩风格
- 剧情:12 个场景,约 2-3 分钟

准备进入生产阶段,生成详细的分镜脚本。

继续吗?
[继续] [修改主题] [修改风格] [修改剧情]
用户选择
复制代码
继续

第二阶段:生产阶段

步骤 4:脚本编写(script-writer)
diff 复制代码
正在生成分镜脚本...

基于你的故事,我将为每个场景生成:
- 视觉描述
- 对话和旁白
- 镜头运动
- AI 生成提示词

预计需要 2-3 分钟...
script.json 输出(部分)
json 复制代码
{
  "project_id": "2025-01-11-friendship",
  "story_title": "莉莉的新朋友",
  "theme": "友谊的力量",
  "style": "温暖水彩风格",
  "target_audience": "3-6岁儿童",
  "total_scenes": 12,
  "estimated_duration": "2:15",
  "scenes": [
    {
      "sequence": 1,
      "duration": 10,
      "location": "新家门口的草地",
      "time_of_day": "清晨",
      "story_content": "小白兔莉莉站在新家门口,好奇地看着远处的树林。远处传来阵阵欢快的笑声。",
      "visual_description": {
        "main_elements": "白色小兔莉莉,粉色蝴蝶结,大蓝眼睛,站立姿态,身体微微前倾",
        "background": "绿色草地,远处有树林,阳光温暖",
        "lighting": "柔和的晨光,温暖色调",
        "mood": "好奇、期待、略带害羞"
      },
      "character_state": {
        "pose": "站立,身体略微向前倾",
        "expression": "眼睛睁大,耳朵竖起,好奇的表情",
        "emotion": "好奇但害羞"
      },
      "camera_movement": "缓慢推进,从全景到中景",
      "dialogue": {
        "speaker": "旁白",
        "text": "小白兔莉莉刚搬到新家,她听到远处传来欢快的笑声。"
      },
      "ai_prompt": {
        "image_generation": "A cute white rabbit named Lily with a pink bow and big blue eyes, standing at the doorway of her new home, looking curiously at the distant forest, warm watercolor style, soft morning light, green grass and trees in background, gentle and dreamy atmosphere, children's book illustration",
        "video_generation": "莉莉站在新家门口,好奇地看着远处,背景:绿色草地和花朵,光照:柔和的晨光,镜头缓慢推进"
      }
    },
    {
      "sequence": 2,
      "duration": 8,
      "location": "新家门口的草地",
      "time_of_day": "清晨",
      "story_content": "莉莉听到远处树林里传来小动物们的欢笑声,她的心跳加快了。",
      "visual_description": {
        "main_elements": "莉莉站立,耳朵竖起,专注聆听",
        "background": "同场景1,视角更近",
        "lighting": "柔和的晨光",
        "mood": "好奇、兴奋、犹豫"
      },
      "character_state": {
        "pose": "站立,身体微微后仰",
        "expression": "耳朵一只竖起一只垂下,眼神犹豫",
        "emotion": "犹豫不决"
      },
      "camera_movement": "静止,聚焦角色表情",
      "dialogue": {
        "speaker": "莉莉内心",
        "text": "我好想去看看...但是,他们会喜欢我吗?"
      },
      "ai_prompt": {
        "image_generation": "White rabbit Lily with pink bow, listening carefully with one ear up and one down, hesitant expression, warm watercolor style, soft morning light, green meadow background, emotional and gentle atmosphere",
        "video_generation": "莉莉听到远处的笑声,耳朵竖起,好奇地抬头,背景:树林入口,光照:阳光透过树叶,镜头:轻微推进"
      }
    }
    // ... 场景 3-12 类似结构
  ],
  "generated_at": "2025-01-11T10:20:00Z"
}

生产阶段检查点
css 复制代码
✅ 生产阶段完成!

分镜脚本已确认:
- 总场景数:12 个
- 预计视频时长:2 分 15 秒
- AI Prompts:已为每个场景生成

你想:
[继续] [预览脚本] [修改某个场景]
用户选择
复制代码
继续

第三阶段:视频生成方式选择(路由)

css 复制代码
━━━━━━━━━━━━━━━━━━━━━━━━━━━━
🎬 选择视频生成方式:

A) 火山引擎流程(全自动,推荐)
   ✅ 自动生成图片
   ✅ 自动生成视频(图片转视频)
   ✅ 自动合成
   ⏱️  预计:60-80分钟
   💰 成本:约 ¥6.24

B) Sora 流程(高级,需手动操作)
   ✅ 生成专业 Sora Prompts
   ✅ 强化角色一致性和世界状态管理
   ✅ 适合 Sora 世界模型的连续性视频
   ⚠️  需要手动在 Sora 平台生成视频
   ⏱️  预计:视 Sora 速度而定
   💰 成本:视 Sora 定价而定

请选择(A/B):

路径分支演示


🔵 路径 A:火山引擎流程

用户选择
css 复制代码
A
响应
diff 复制代码
已选择:火山引擎流程(全自动)

准备开始生成阶段...

检查 AI 服务配置:
- 图片生成服务:火山引擎 Seedream 4.5 ✅
- 视频生成服务:火山引擎 Seedance 1.5 Pro ✅
- API 密钥:已配置 ✅

预估成本:
- 图片生成(12场景):¥0.24
- 视频生成(~135秒):¥6.75
- 总计:¥6.99

继续吗?[是/否]
用户确认
复制代码

步骤 5:图片生成(image-generator)
css 复制代码
开始图片生成...

生成模式:
A) 逐个生成(推荐) - 每个场景审核后继续
B) 批量生成 - 一次性提交,20-30分钟后审核

请选择:
用户选择
css 复制代码
B
erlang 复制代码
正在批量生成图片...

场景 01 - 新家门口
🎨 使用 Prompt: A cute white rabbit named Lily with a pink bow...
⏳ 提交中...
✅ 已提交,任务ID: img_001

场景 02 - 远处的欢笑
🎨 使用 Prompt: White rabbit Lily with pink bow, listening carefully...
⏳ 提交中...
✅ 已提交,任务ID: img_002

... (场景 3-12)

━━━━━━━━━━━━━━━━━━━━━━
所有场景已提交!

预计生成时间:20-30 分钟
当前进度:12/12 已提交

我会持续监控生成进度,完成后自动通知你...
diff 复制代码
[20 分钟后]

━━━━━━━━━━━━━━━━━━━━━━
✅ 图片生成完成!

生成统计:
- 成功:12/12
- 失败:0/12
- 总成本:¥0.24
- 用时:22 分钟

所有图片已保存到:
projects/2025-01-11-friendship/assets/images/

准备开始视频生成...
生成的图片文件
bash 复制代码
assets/images/
├── scene-01.png
├── scene-02.png
├── scene-03.png
...
└── scene-12.png

步骤 6:图片上传(oss-uploader)
arduino 复制代码
开始上传图片到阿里云 OSS...

场景 01
⏳ 上传中... scene-01.png
✅ 已上传
📎 OSS URL: https://xxx.aliyuncs.com/.../scene-01.png

场景 02
⏳ 上传中... scene-02.png
✅ 已上传
📎 OSS URL: https://xxx.aliyuncs.com/.../scene-02.png

... (场景 3-12)

━━━━━━━━━━━━━━━━━━━━━━
✅ 所有图片已上传!

12/12 图片已上传到 OSS
准备开始视频生成...

步骤 7:视频生成(video-generator)
erlang 复制代码
开始视频生成...

生成方式:图片转视频(连续生成模式)

━━━━━━━━━━━━━━━━━━━━━━
场景 01 (10秒)
📷 使用原始图片:scene-01.png
🎬 场景描述:莉莉站在新家门口,好奇地看着远处...
⏳ 生成中...

[3 分钟后]
✅ 生成完成!
💰 成本:¥0.50
🔗 已保存尾帧URL(供场景02使用)

━━━━━━━━━━━━━━━━━━━━━━
场景 02 (8秒)
🔗 使用前一个视频的尾帧
🎬 场景描述:莉莉听到远处的笑声,耳朵竖起...
⏳ 生成中...

[3 分钟后]
✅ 生成完成!
💰 成本:¥0.40
🔗 已保存尾帧URL(供场景03使用)

━━━━━━━━━━━━━━━━━━━━━━
场景 03 (10秒)
🔗 使用前一个视频的尾帧
🎬 场景描述:莉莉慢慢走向树林...
⏳ 生成中...

... (场景 4-12 类似过程)

━━━━━━━━━━━━━━━━━━━━━━
✅ 所有视频生成完成!

生成统计:
- 总场景数:12 个
- 成功生成:12 个
- 总时长:2 分 15 秒
- 总成本:¥6.75
- 用时:38 分钟

所有视频已保存到:
projects/2025-01-11-friendship/assets/videos/

准备进入视频合成阶段...
生成的视频文件
scss 复制代码
assets/videos/
├── scene-01.mp4 (10秒)
├── scene-02.mp4 (8秒)
├── scene-03.mp4 (10秒)
...
└── scene-12.mp4 (10秒)

步骤 8:视频合成(video-compositor)
diff 复制代码
开始视频合成...

合成配置:
- 转场效果:柔和淡化
- 背景音乐:温暖轻快的儿童音乐
- 旁白:AI 语音生成(童声)
- 分辨率:1920x1080 @ 24fps

开始合成?[是/否]
用户确认
复制代码
diff 复制代码
⏳ 正在合成视频...

步骤 1/5:读取所有视频片段
✅ 已读取 12 个视频片段

步骤 2/5:添加转场效果
✅ 11 个转场效果已添加

步骤 3/5:生成 AI 旁白
⏳ 正在生成旁白音频...
✅ 旁白已生成(12 段)

步骤 4/5:添加背景音乐
✅ 背景音乐已添加(自动匹配音量)

步骤 5/5:导出最终视频
⏳ 导出中...

━━━━━━━━━━━━━━━━━━━━━━
🎉 视频生成完成!

最终视频:
- 文件:output/final-video.mp4
- 时长:2 分 18 秒
- 大小:125 MB
- 分辨率:1920x1080 @ 24fps

成本统计:
- 图片生成:¥0.24
- 视频生成:¥6.75
- 旁白生成:¥0.12
- 总成本:¥7.11

视频效果满意吗?

[满意,继续] [重新生成某个场景] [调整音频] [修改配置]
用户选择
复制代码
满意,继续

火山引擎流程完成
php 复制代码
✅ 火山引擎流程已完成!

项目文件结构:
projects/2025-01-11-friendship/
├── metadata.json
├── creative/
│   ├── theme.json
│   ├── style.json
│   └── story.md
├── production/
│   └── script.json
├── assets/
│   ├── images/       # 12 张图片
│   └── videos/       # 12 个视频片段
└── output/
    └── final-video.mp4  # 最终视频

准备进入沉淀阶段(可选)...

🟢 路径 B:Sora 流程

用户选择
css 复制代码
B
响应
markdown 复制代码
已选择:Sora 流程(高级)

开始 Sora 视频生成流程...

这个流程将生成专业的 Sora Prompts,你需要:
1. 等待系统生成 Prompts
2. 手动在 Sora 平台生成视频
3. 下载视频并放入指定目录
4. 返回继续合成

预计需要 5-10 分钟准备 Prompts
生成视频的时间取决于 Sora 平台

继续吗?[是/否]
用户确认
复制代码

步骤 5:世界状态分析(story-analyzer)
markdown 复制代码
第一步:分析世界状态

正在分析故事脚本,提取全局叙事状态...

━━━━━━━━━━━━━━━━━━━━━━
分析中...

✅ 已提取全局风格
✅ 已识别目标受众
✅ 已提取主角信息
✅ 已分析情感弧线
✅ 已定义世界约束

━━━━━━━━━━━━━━━━━━━━━━
✅ Story Analyzer 完成!

世界状态已提取:
- 全局风格:温暖水彩风格,柔和色调,梦幻氛围
- 目标受众:3-6岁儿童
- 主角:莉莉(小白兔)
  外观:白色柔软的毛发,头顶粉色蝴蝶结,大大的蓝色眼睛,长长的耳朵
- 情感弧线:7 个节点
  1. 好奇但害羞
  2. 犹豫不决
  3. 鼓起勇气
  4. 尝试接近
  5. 感到温暖
  6. 建立友谊
  7. 快乐满足
- 世界约束:已定义
  - 主要地点:森林边缘的绿色草地
  - 时间流动:连续(continuous)
  - 物理规则:现实物理,轻微卡通化

输出文件:
📄 projects/2025-01-11-friendship/production/sora-workflow/world_state.json

准备进入下一步:Scene Planner
world_state.json 内容
json 复制代码
{
  "global_style": "温暖水彩风格,柔和色调,梦幻氛围",
  "target_audience": "3-6岁儿童",
  "main_character": {
    "name": "莉莉",
    "species": "小白兔",
    "fixed_appearance": "白色柔软的毛发,头顶粉色蝴蝶结,大大的蓝色眼睛,长长的耳朵,小巧的鼻子"
  },
  "emotional_arc": [
    "好奇但害羞",
    "犹豫不决",
    "鼓起勇气",
    "尝试接近",
    "感到温暖",
    "建立友谊",
    "快乐满足"
  ],
  "world_constraints": {
    "primary_location": "森林边缘的绿色草地,远处是茂密的树林",
    "time_flow": "continuous",
    "physics": "现实物理,角色动作轻微卡通化",
    "visual_consistency_notes": "主角外观必须在所有场景保持完全一致;背景保持温暖的绿色和金色色调;光照自然柔和"
  }
}

步骤 6:场景规划(scene-planner)
erlang 复制代码
第二步:场景规划

正在将每个场景转换为规范化的 SceneSpec...

━━━━━━━━━━━━━━━━━━━━━━
处理场景 1/12...
✅ scene-01.spec.json 已保存
   连续性:否(开场)

处理场景 2/12...
✅ scene-02.spec.json 已保存
   连续性:是(延续场景1)

处理场景 3/12...
✅ scene-03.spec.json 已保存
   连续性:是(延续场景2)

处理场景 4/12...
✅ scene-04.spec.json 已保存
   连续性:是(延续场景3)

处理场景 5/12...
✅ scene-05.spec.json 已保存
   连续性:否(场景切换到树后)

处理场景 6/12...
✅ scene-06.spec.json 已保存
   连续性:是(延续场景5)

... (场景 7-12)

━━━━━━━━━━━━━━━━━━━━━━
✅ Scene Planner 完成!

所有场景已规范化:
- 总场景数:12 个
- 连续场景:9 个
- 场景切换:3 个

输出目录:
📁 projects/2025-01-11-friendship/production/sora-workflow/scene_specs/

准备进入下一步:Prompt Compiler
scene-01.spec.json 示例
json 复制代码
{
  "scene_id": "scene-01",
  "duration_seconds": 10,
  "continuation": false,
  "story_state": {
    "current_emotion": "好奇但害羞",
    "change_from_previous": "故事开场",
    "narrative_purpose": "介绍主角和初始状态"
  },
  "character_state": {
    "pose": "站立,身体略微向前倾",
    "facial_expression": "眼睛睁大,耳朵竖起,表现出好奇",
    "attention_focus": "远处的树林和传来的笑声"
  },
  "environment_state": {
    "location": "新家门口的绿色草地",
    "time_of_day": "清晨",
    "must_remain_consistent": [
      "主角外观:白色柔软的毛发,粉色蝴蝶结,大大的蓝眼睛,长长的耳朵",
      "背景色调:温暖的绿色和金色",
      "远处树林的位置"
    ]
  },
  "camera_intent": {
    "shot_type": "中景",
    "movement": "缓慢推进"
  }
}

步骤 7:Prompt 编译(prompt-compiler)
diff 复制代码
第三步:Prompt 编译

正在将 SceneSpec 编译为 Sora Prompts...

━━━━━━━━━━━━━━━━━━━━━━
编译场景 1/12...
✅ scene-01.sora.txt 已保存
   时长:10秒
   连续性:否

编译场景 2/12...
✅ scene-02.sora.txt 已保存
   时长:8秒
   连续性:是

编译场景 3/12...
✅ scene-03.sora.txt 已保存
   时长:10秒
   连续性:是

... (场景 4-12)

━━━━━━━━━━━━━━━━━━━━━━
✅ Prompt Compiler 完成!

所有 Sora Prompts 已生成:
- 总场景数:12 个
- 总时长:约 2 分 15 秒
- 连续场景:9 个
- 场景切换:3 个

输出目录:
📁 projects/2025-01-11-friendship/production/sora-workflow/prompts/
scene-01.sora.txt 示例
vbnet 复制代码
This is the opening scene of the story.

This scene introduces the main character and establishes the initial state. The emotional tone is curious but shy.

A young white rabbit named Lily is the main character. She has soft white fur, a pink bow on her head, large blue eyes, and long ears. In this scene, she is standing with her body leaning slightly forward, with wide eyes and perked-up ears, focusing on the distant forest where laughter can be heard.

The environment is a green grassy meadow at her new home's entrance. The time of day is early morning. The lighting is soft and warm, with the distant forest visible in the background. Key visual elements include the green grass, the position of the distant forest, and the gentle morning light.

Lily is alone in this scene.

Her subtle actions include breathing gently, ears twitching slightly, showing curiosity and hesitation.

The mood is peaceful and hopeful, with a hint of nervousness.

The camera uses a medium shot, slowly pushing in toward Lily, emphasizing her emotional state.

The visual style is warm watercolor with soft tones, dreamy atmosphere, suitable for children aged 3-6.

Duration: about 10 seconds.
scene-02.sora.txt 示例
vbnet 复制代码
Continue the video from the previous scene.

This scene continues to build tension and emotional development. The emotional tone is hesitant and uncertain. Lily's emotion shifts from curiosity to hesitation as she processes what she heard.

A young white rabbit named Lily is the main character. She has soft white fur, a pink bow on her head, large blue eyes, and long ears. In this scene, she is standing with her body slightly leaning back, with one ear up and one ear down, showing a hesitant expression, focusing between the forest entrance and her own paws.

The environment is the same green grassy meadow at her new home's entrance. The time of day is still early morning. The visual continuity with the previous scene must be maintained completely, including the green grass, the warm golden tones, and the position of elements.

Lily is still alone in this scene.

Her subtle actions include breathing gently, ears moving independently showing her inner conflict, eyes glancing back and forth.

The mood is uncertain and contemplative.

The camera remains still, focusing on Lily's facial expression to capture her emotional struggle.

The visual style is warm watercolor with soft tones, dreamy atmosphere, suitable for children aged 3-6.

Duration: about 8 seconds.

步骤 8:手动生成指引
bash 复制代码
━━━━━━━━━━━━━━━━━━━━━━━━━━━━
📋 Sora 手动生成指南

Sora Prompts 已准备完毕!

接下来的步骤:

1️⃣  打开 Sora 平台
   访问:https://sora.com (或你使用的 Sora 平台)

2️⃣  逐个生成视频
   使用以下 Prompts 文件:

   场景 01 (10秒) - 开场
   📄 projects/2025-01-11-friendship/production/sora-workflow/prompts/scene-01.sora.txt

   场景 02 (8秒) - 连续
   📄 projects/2025-01-11-friendship/production/sora-workflow/prompts/scene-02.sora.txt

   场景 03 (10秒) - 连续
   📄 projects/2025-01-11-friendship/production/sora-workflow/prompts/scene-03.sora.txt

   场景 04 (8秒) - 连续
   📄 projects/2025-01-11-friendship/production/sora-workflow/prompts/scene-04.sora.txt

   场景 05 (10秒) - 场景切换
   📄 projects/2025-01-11-friendship/production/sora-workflow/prompts/scene-05.sora.txt

   场景 06 (12秒) - 连续
   📄 projects/2025-01-11-friendship/production/sora-workflow/prompts/scene-06.sora.txt

   场景 07 (10秒) - 连续
   📄 projects/2025-01-11-friendship/production/sora-workflow/prompts/scene-07.sora.txt

   场景 08 (8秒) - 连续
   📄 projects/2025-01-11-friendship/production/sora-workflow/prompts/scene-08.sora.txt

   场景 09 (12秒) - 连续
   📄 projects/2025-01-11-friendship/production/sora-workflow/prompts/scene-09.sora.txt

   场景 10 (10秒) - 连续
   📄 projects/2025-01-11-friendship/production/sora-workflow/prompts/scene-10.sora.txt

   场景 11 (8秒) - 连续
   📄 projects/2025-01-11-friendship/production/sora-workflow/prompts/scene-11.sora.txt

   场景 12 (10秒) - 连续
   📄 projects/2025-01-11-friendship/production/sora-workflow/prompts/scene-12.sora.txt

3️⃣  下载生成的视频
   将每个视频命名为:
   - scene-01.mp4
   - scene-02.mp4
   - scene-03.mp4
   - scene-04.mp4
   - scene-05.mp4
   - scene-06.mp4
   - scene-07.mp4
   - scene-08.mp4
   - scene-09.mp4
   - scene-10.mp4
   - scene-11.mp4
   - scene-12.mp4

4️⃣  放入项目目录
   将所有视频文件放入:
   📁 projects/2025-01-11-friendship/assets/videos/

5️⃣  返回继续
   完成后,在此对话中输入:
   "Sora 视频已生成完成"

━━━━━━━━━━━━━━━━━━━━━━━━━━━━

⏸️  流程已暂停,等待你完成 Sora 生成...

提示:
- 建议按顺序生成,确保视觉连续性
- 标记为"连续"的场景会从前一场景延续
- 如果某个场景效果不满意,可以重新生成
- 所有视频生成完成后,再一起放入目录

[模拟:用户在 Sora 平台生成视频]
markdown 复制代码
[用户操作过程...]

1. 打开 Sora 平台
2. 复制 scene-01.sora.txt 内容
3. 在 Sora 输入框粘贴
4. 点击"生成"
5. 等待 3-5 分钟
6. 下载生成的视频,命名为 scene-01.mp4
7. 重复步骤 2-6 for 场景 2-12

[约 60-90 分钟后,所有视频生成完成]

步骤 9:用户返回确认
用户输入
复制代码
Sora 视频已生成完成
响应
scss 复制代码
正在检查视频文件...

检查 assets/videos/ 目录:
✅ scene-01.mp4 已找到 (10秒, 45 MB)
✅ scene-02.mp4 已找到 (8秒, 38 MB)
✅ scene-03.mp4 已找到 (10秒, 47 MB)
✅ scene-04.mp4 已找到 (8秒, 36 MB)
✅ scene-05.mp4 已找到 (10秒, 48 MB)
✅ scene-06.mp4 已找到 (12秒, 56 MB)
✅ scene-07.mp4 已找到 (10秒, 46 MB)
✅ scene-08.mp4 已找到 (8秒, 39 MB)
✅ scene-09.mp4 已找到 (12秒, 54 MB)
✅ scene-10.mp4 已找到 (10秒, 45 MB)
✅ scene-11.mp4 已找到 (8秒, 37 MB)
✅ scene-12.mp4 已找到 (10秒, 44 MB)

━━━━━━━━━━━━━━━━━━━━━━
✅ 所有视频已确认!

视频统计:
- 总场景数:12 个
- 总时长:2 分 16 秒
- 总大小:535 MB
- 所有文件已就位

准备进入视频合成阶段...

步骤 10:视频合成(video-compositor)
diff 复制代码
开始视频合成...

合成配置:
- 转场效果:柔和淡化
- 背景音乐:温暖轻快的儿童音乐
- 旁白:AI 语音生成(童声)
- 分辨率:1920x1080 @ 24fps

开始合成?[是/否]
用户确认
复制代码
diff 复制代码
⏳ 正在合成视频...

步骤 1/5:读取所有视频片段
✅ 已读取 12 个 Sora 生成的视频片段

步骤 2/5:添加转场效果
✅ 11 个转场效果已添加

步骤 3/5:生成 AI 旁白
⏳ 正在生成旁白音频...
✅ 旁白已生成(12 段)

步骤 4/5:添加背景音乐
✅ 背景音乐已添加(自动匹配音量)

步骤 5/5:导出最终视频
⏳ 导出中...

━━━━━━━━━━━━━━━━━━━━━━
🎉 视频生成完成!

最终视频:
- 文件:output/final-video.mp4
- 时长:2 分 16 秒
- 大小:148 MB
- 分辨率:1920x1080 @ 24fps
- 生成方式:Sora

视频特点:
✅ 角色外观高度一致
✅ 视觉风格统一
✅ 场景连续性流畅
✅ 世界状态管理清晰

视频效果满意吗?

[满意,继续] [重新生成某个场景] [调整音频]
用户选择
复制代码
满意,继续

Sora 流程完成
php 复制代码
✅ Sora 流程已完成!

项目文件结构:
projects/2025-01-11-friendship/
├── metadata.json
├── creative/
│   ├── theme.json
│   ├── style.json
│   └── story.md
├── production/
│   ├── script.json
│   └── sora-workflow/        # Sora 专用目录
│       ├── world_state.json
│       ├── scene_specs/
│       │   ├── scene-01.spec.json
│       │   ├── scene-02.spec.json
│       │   └── ...
│       └── prompts/
│           ├── scene-01.sora.txt
│           ├── scene-02.sora.txt
│           └── ...
├── assets/
│   └── videos/               # Sora 生成的视频(无图片)
│       ├── scene-01.mp4
│       ├── scene-02.mp4
│       └── ...
└── output/
    └── final-video.mp4       # 最终合成视频

准备进入沉淀阶段(可选)...

第四阶段:沉淀阶段(两条路径汇合)

diff 复制代码
准备进入沉淀阶段(可选)

是否保存可复用的资产到素材库?

沉淀资产的好处:
- 下次创作可直接复用主题和风格
- 节省创作时间(5-10分钟)
- 复用高质量 Prompt(提高成功率)

[开始沉淀] [跳过,直接完成]
用户选择
复制代码
开始沉淀
css 复制代码
正在分析可沉淀资产...

发现:
✅ 主题模板:友谊的力量
✅ 风格配置:温暖水彩
✅ Prompt 模板:3 个高质量场景
✅ 背景素材:2 个可复用背景
✅ 音频配置:音乐和旁白设置

保存这些资产?[是/否]
用户确认
复制代码
bash 复制代码
⏳ 正在保存资产...

✅ 主题模板已保存到 library/themes/
✅ 风格配置已保存到 library/styles/
✅ Prompt 模板已保存到 library/prompts/
✅ 音频配置已保存到 library/audio/

素材库已更新!

项目完成

diff 复制代码
🎉 项目完成!

最终成果:
- 视频文件:output/final-video.mp4
- 时长:2 分 16 秒
- 生成方式:[火山引擎 / Sora]
- 总成本:[¥7.11 / 视 Sora 定价]

项目资料:
- 剧情文档:creative/story.md
- 分镜脚本:production/script.json
[火山引擎] - 图片素材:assets/images/ (12 张)
[Sora] - Sora Prompts:production/sora-workflow/prompts/ (12 个)
- 视频片段:assets/videos/ (12 个)

资产沉淀:
- 1 个主题模板
- 1 个风格配置
- 3 个 Prompt 模板
- 2 个背景素材

感谢使用 PBVC!

你可以:
1) 下载最终视频
2) 查看生成记录
3) 开始创作下一个视频

两条路径对比总结

火山引擎流程

时间线:

  • 创意阶段:15 分钟
  • 生产阶段:5 分钟
  • 图片生成:22 分钟
  • 视频生成:38 分钟
  • 合成:5 分钟
  • 总计:约 85 分钟

成本: ¥7.11

特点:

  • ✅ 全自动
  • ✅ 成本低
  • ✅ 速度可控
  • ❌ 图片转视频,风格可能略有差异

Sora 流程

时间线:

  • 创意阶段:15 分钟
  • 生产阶段:5 分钟
  • Story Analyzer:2 分钟
  • Scene Planner:3 分钟
  • Prompt Compiler:2 分钟
  • 手动 Sora 生成:60-90 分钟
  • 合成:5 分钟
  • 总计:约 92-122 分钟

成本: 视 Sora 定价

特点:

  • ✅ 文本直接生成,风格高度统一
  • ✅ 角色一致性强
  • ✅ 世界状态管理清晰
  • ❌ 需要手动操作
  • ❌ 时间和成本不可控

完整文件清单

火山引擎流程
php 复制代码
projects/2025-01-11-friendship/
├── metadata.json                 # 项目元数据
├── creative/
│   ├── theme.json               # 主题信息
│   ├── style.json               # 风格配置
│   └── story.md                 # 故事剧情
├── production/
│   └── script.json              # 分镜脚本
├── assets/
│   ├── images/                  # 12 张图片
│   │   ├── scene-01.png
│   │   └── ...
│   └── videos/                  # 12 个视频
│       ├── scene-01.mp4
│       └── ...
└── output/
    └── final-video.mp4          # 最终视频
Sora 流程
php 复制代码
projects/2025-01-11-friendship/
├── metadata.json                 # 项目元数据
├── creative/
│   ├── theme.json               # 主题信息
│   ├── style.json               # 风格配置
│   └── story.md                 # 故事剧情
├── production/
│   ├── script.json              # 分镜脚本
│   └── sora-workflow/           # Sora 专用
│       ├── world_state.json     # 世界状态
│       ├── scene_specs/         # 场景规格
│       │   ├── scene-01.spec.json
│       │   └── ...
│       └── prompts/             # Sora Prompts
│           ├── scene-01.sora.txt
│           └── ...
├── assets/
│   └── videos/                  # 12 个视频(无图片)
│       ├── scene-01.mp4
│       └── ...
└── output/
    └── final-video.mp4          # 最终视频

结论

两条路径都能成功生成高质量的绘本视频,选择哪条路径取决于:

  • 预算:火山引擎更便宜
  • 时间:火山引擎更快且全自动
  • 质量要求:Sora 角色一致性和视觉统一性更好
  • 技术水平:火山引擎无需手动操作

推荐策略:

  1. 先用火山引擎快速验证创意
  2. 确认满意后,用 Sora 生成最终版本

这样既高效又能保证质量!

相关推荐
人工小情绪2 小时前
深度学习模型部署
人工智能·深度学习
Codelinghu2 小时前
「 LLM实战 - 企业 」构建企业级RAG系统:基于Milvus向量数据库的高效检索实践
人工智能·后端·llm
幻云20102 小时前
Next.js指南:从入门到精通
开发语言·javascript·人工智能·python·架构
智算菩萨2 小时前
Anthropic Claude 4.5:AI分层编排的革命,成本、速度与能力的新平衡
前端·人工智能
小Pawn爷2 小时前
12. 智能与风险并存:金融AI的成本,合规与伦理平衡术
人工智能·金融·llm·合规
●VON2 小时前
AI 保险机制:为智能时代的不确定性兜底
人工智能·学习·安全·制造·von
开发者导航2 小时前
【开发者导航】一键解决AI生成内容格式复制难题的剪贴板工具:PasteMD
人工智能
bu_shuo2 小时前
将AI生成的数学公式正确复制到word中
人工智能·chatgpt·word·latex
AI科技星2 小时前
光速飞行器动力学方程的第一性原理推导、验证与范式革命
数据结构·人工智能·线性代数·算法·机器学习·概率论