这几个 .7z 都是 Windows 绿色版(portable) ,区别只在于 内置的 PyTorch / CUDA 版本 和 体积。一句话总结:
| 文件名 | 内置 CUDA / PyTorch | 适用显卡驱动 | 体积 | 特点 |
|---|---|---|---|---|
amd |
CPU-only 或 ROCm(AMD 卡) | 不限 | 610 MB | 最小,N 卡别下;A 卡/纯 CPU 才选 |
nvidia |
cu121(默认) | ≥ 531 | 1.61 GB | 通用 NV 版,老卡到新卡都能跑 |
nvidia_cu126 |
cu126 | ≥ 535 | 1.59 GB | 支持 40 系 Super / 30 系新驱动优化 |
nvidia_cu128 |
cu128(最新) | ≥ 537 | 1.83 GB | 算子最新、体积最大,40 系、50 系首选,老卡也能向下兼容 |
✅ 怎么选
-
NVIDIA 显卡 → 直接拿 cu128(最大最全,1.83 GB)
-
AMD 显卡 → 用 amd(610 MB)
-
纯 CPU 跑图 → 同样 amd 即可
注意:cu128 需要驱动 ≥ 537(2024 年以后的官方驱动都满足),装完解压即用,无需再配 CUDA。
VACE 是阿里巴巴通义实验室在 Wan2.1 时代提出的「一站式视频创作与编辑框架」,名字拆开就是:
-
Video
-
A ll-in-one C reation & Editing
T2V 则是它支持的四大核心子任务之一:
- T ext-to-Video(文本生成视频)------只给一句文字,模型直接出动态画面。
换句话说:
VACE 是整套"工具箱" ,里面包含 T2V、R2V、V2V、MV2V 等多个工具;
T2V 只是其中一把"螺丝刀",专管"纯文本→视频"这件事
FLF2V 是 "First-Last-Frame to Video" 的缩写,意为「首尾帧生成视频」:
只需给出起始帧 + 结束帧 两张图像,模型便自动填补中间的全部过渡画面,输出一段5 秒、720p 且逻辑连贯的高清视频 。