阿里云无影GPU部署WAN2.2模型

部署参考:

https://github.com/Wan-Video/Wan2.2/tree/main

部署模型:T2V-A14B

资源开通:

登陆无影

修改策略以支持复制内容到ubuntu执行,需要替换这个instance的策略为新的:


Ensure torch >= 2.4.0

If the installation of flash_attn fails, try installing the other packages first and install flash_attn last

pip install -r requirements.txt

flash_attn依赖torch,先安装torch:

pip install -r requirements.txt 后继续报错

flash-attn 是阿里 Wan2.2 模型能跑起来的关键。它能极大减少显存占用并提高生成视频的速度。如果没有它,即使你模型跑起来了,显存也会瞬间爆掉(OOM)

截图问题的核心非常明确:你只有 GPU 驱动,但缺少 CUDA Toolkit(开发套件),导致系统找不到 nvcc 编译器。

apt-get install nvidia-cuda-toolkit

#一般别apt, 版本太旧且容易乱,引发报错。直接wget官网https://developer.download.nvidia.com/compute/cuda/12.\*\*\*\*

sudo sh cuda_12.4.1_550.54.15_linux.run

安装时的选项操作(一定要看):

输入 accept 后回车。

【重点】 在出现的菜单里,你会看到 [X] Driver。

请按空格键,把它变成 [ ] Driver。(取消勾选驱动,我们只装 Toolkit)。

确保 [X] CUDA Toolkit 12.4 是勾选状态。

移动光标到 Install,按回车。

\] Driver:你已经取消了驱动勾选,这样就不会覆盖你现有的 12.8 驱动,保证了系统的安全。 \[X\] CUDA Toolkit 12.4:你勾选了开发套件,这会安装我们急需的 nvcc 编译器。 ![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/6f1ed8f56b5c412f8fdcaf6532f3dcab.png) ![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/6c927bcec8b84fd7ae3114e25bb29ffe.png) pip install flash-attn 是出了名的慢 ![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/b47069d96473408ca2d0f5a920fa443d.png) 因为 flash-attn 包含大量的底层 CUDA 内核代码。当你执行这条命令时,你的机器正在: 调用你刚装好的 nvcc 编译器。 针对你的显卡架构,现场把几万行 C++/CUDA 代码编译成二进制。 这个过程极度消耗 CPU 和内存。 pip install https://github.com/Dao-AILab/flash-attention/releases/download/v2.7.0.post2/flash_attn-2.7.0.post2+cu124torch2.4cxx11abiFalse-cp310-cp310-linux_x86_64.whl ---上海的机器似乎有github墙 PyTorch 版本需要慎重考虑。如果选择太新的话,配套包跟不上。

相关推荐
小仓桑4 小时前
【Agent智能体项目实战三】LangChain调用通义千问保姆级教程
数据库·阿里云·langchain·agent
kyle~6 小时前
云端数据存储---阿里云OSS
阿里云·云计算
云算计6 小时前
给太空云计算提出10个问题
云计算
李白你好7 小时前
云安全渗透测试框架 - 支持 AWS、Azure、GCP、阿里云、腾讯云、华为云的综合渗透测试工具和指南
阿里云·azure·aws
※※冰馨※※8 小时前
【C++】通过 Git 访问阿里云 Codeup 仓库
git·阿里云·云计算
摇滚侠8 小时前
JAVA 项目教程《苍穹外卖-番外篇-阿里云对象存储》,微信小程序项目,前后端分离,从开发到部署
阿里云·云计算
小仓桑1 天前
【Agent智能体项目实战一】阿里云通义千问兼容 OpenAI 接口实现 AI 对话
人工智能·阿里云·云计算·agent
AI周红伟1 天前
周红伟:豆包大模型的尽头是直播间,豆包开启AI购物内测 电商平台加码“一句话购物”
人工智能·阿里云·云计算·腾讯云·openclaw
威联通安全存储1 天前
某大型食品饮料企业:基于威联通 TS-h1290FX 的中央数据管控与合规实践
大数据·人工智能·云计算
大树881 天前
国产液冷产业链的突破:应对龙虾大模型等终端算力需求激增的倒逼效应
科技·ai·云计算