在目前的 AI 视频生成领域，图生视频（Image-to-Video）的控制力一直是个痛点。很多时候，传统的单提示词（Prompt）很难兼顾"画面主旨"与"细节变化"，导致生成的视频要么疯狂致敬原图（完全不动），要么直接放飞自我（画面崩坏）。

近期，基于 Ltx 核心架构演进的 Ltx2.3-relay-smart 整合包**正式亮相。它最大的亮点在于引入了"主提示词 + 详细提示词"的双轨驱动机制，大幅提升了视频的语义遵从度与运动稳定性。

今天这篇教程就带大家拆解这个整合包的核心优势、工作原理以及保姆级的使用指南。

一、为什么是 Ltx2.3-relay-smart？三大核心痛点解决

传统的图生视频模型，往往是将图片和一段长提示词一股脑丢给 Transformer 模块，模型很容易"顾此失彼"。而 Ltx2.3-relay-smart 采用了更聪明的"中继智能（Relay-Smart）"策略：

语义解耦：主提示词 vs 详细提示词

主提示词（Core Prompt）：负责定调。告诉模型"谁在做什么"，决定核心动作和主线剧情。

详细提示词（Detail Prompt）：负责定型。补充环境、光影、材质、运镜等微观信息。

> 优势：这种双向注入机制，既保证了视频不会脱离主线，又让画面细节丰富、转场自然。

运动稳定性（Stability）大幅提升

依托 Ltx2.3 优化后的时序注意力机制（Temporal Attention），模型能够精准预测前后帧的像素走向，有效缓解了AI视频常见的"肢体融化"、"背景扭曲"等硬伤。

一键式一包整合

免去了繁琐的 Python 环境配置、CUDA 版本对齐以及 Hugging Face 权重手动下载。解压即用，对显卡不宽裕的个人创作者非常友好。

二、核心工作流与参数解析

在 Ltx2.3-relay-smart 的 WebUI 界面中，核心控制流可以用以下公式来概括：

为了让大家快速上手，我们来看一下界面中的核心参数该如何调整：

| 参数名称 | 推荐初始值 | 作用解析 |

|---|---|---|

|Motion Bucket (运动强度) | 64 - 128 | 数值越大动作幅度越大，过大容易崩坏，建议从80开始测试。 |

|主提示词权重 (Weight 1) | 1.0 | 引导视频核心走向的强度，通常保持默认。 |

|详细提示词权重 (Weight 2) | 0.7 - 0.9 | 丰富画面的权重，不宜反超主提示词，否则容易喧宾夺主。 |

|Frame Rate (帧率)** | 16 / 24 | 决定视频的流畅度。 |

三、实战演练：如何写出"高遵从度"的双轨提示词

想要发挥出 Ltx2.3-relay-smart 的威力，提示词的喂法至关重要。

❌ 错误示范（传统单提示词模式）

> Prompt: 一只猫在赛博朋克的街道上奔跑，到处都是霓虹灯，下着雨，路面有积水反光，电影级画质。

> *缺点：模型可能光顾着渲染霓虹灯和雨水，忘记让猫跑起来，或者猫跑着跑着变成了狗。*

正确示范（Ltx2.3 双轨模式）

主提示词（Main Prompt）：

```text

A majestic orange cat running forward intensely on the street.

(一只健壮 text的橘猫在街道上奋力向前奔跑。)

```

详细提示词（Detailed Prompt）：

```text

Cyberpunk style street, neon lights glowing in rain, puddles reflecting city lights, 4k resolution, cinematic lighting, motion blur on background.

(赛博朋克风街道，雨中霓虹灯闪烁，积水反射城市灯光，4k分辨率，电影级光影，背景带有运动模糊。)

```

效果对比：采用双轨模式后，主提示词牢牢锁定了"橘猫奔跑"的核心动作，而详细提示词则完美填充了"赛博朋克"的环境氛围，两者互不干扰，稳定性极佳。

四、本地部署与环境启动（简易版）

如果你已经下载了 Ltx2.3-relay-smart 整合包，只需按照以下步骤启动：

解压整合包：确保路径中不要包含中文或空格（例如放于 `D:\AI_Tools\Ltx2.3_relay_smart`）。
运行启动脚本：双击目录下的 `run_webui.bat` 或 `启动器.exe`。

```bash

顺带提醒：如果遇到显存不足（OOM），可以在启动脚本中加入以下低显存优化参数

python app.py --lowvram --attention-mechanism sdp

```

五、总结与创作建议

Ltx2.3-relay-smart 整合包的出现，标志着开源图生视频模型在"可控性"上又迈出了坚实的一步。通过**主线看主提示词、细节看详细提示词**的逻辑，它让创作者能够以更低的试错成本，生成符合分镜预期的视频片段。

需要整合包及远程部署，请在评论区回复：ltx

AI视频新突破：Ltx2.3-relay-smart 图生视频整合包，双提示词驱动告别画面崩坏

顺带提醒：如果遇到显存不足（OOM），可以在启动脚本中加入以下低显存优化参数