阿里云无影GPU部署WAN2.2模型

部署参考:

https://github.com/Wan-Video/Wan2.2/tree/main

部署模型:T2V-A14B

资源开通:

登陆无影

修改策略以支持复制内容到ubuntu执行,需要替换这个instance的策略为新的:


Ensure torch >= 2.4.0

If the installation of flash_attn fails, try installing the other packages first and install flash_attn last

pip install -r requirements.txt

flash_attn依赖torch,先安装torch:

pip install -r requirements.txt 后继续报错

flash-attn 是阿里 Wan2.2 模型能跑起来的关键。它能极大减少显存占用并提高生成视频的速度。如果没有它,即使你模型跑起来了,显存也会瞬间爆掉(OOM)

截图问题的核心非常明确:你只有 GPU 驱动,但缺少 CUDA Toolkit(开发套件),导致系统找不到 nvcc 编译器。

apt-get install nvidia-cuda-toolkit

#一般别apt, 版本太旧且容易乱,引发报错。直接wget官网https://developer.download.nvidia.com/compute/cuda/12.\*\*\*\*

sudo sh cuda_12.4.1_550.54.15_linux.run

安装时的选项操作(一定要看):

输入 accept 后回车。

【重点】 在出现的菜单里,你会看到 [X] Driver。

请按空格键,把它变成 [ ] Driver。(取消勾选驱动,我们只装 Toolkit)。

确保 [X] CUDA Toolkit 12.4 是勾选状态。

移动光标到 Install,按回车。

\] Driver:你已经取消了驱动勾选,这样就不会覆盖你现有的 12.8 驱动,保证了系统的安全。 \[X\] CUDA Toolkit 12.4:你勾选了开发套件,这会安装我们急需的 nvcc 编译器。 ![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/6f1ed8f56b5c412f8fdcaf6532f3dcab.png) ![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/6c927bcec8b84fd7ae3114e25bb29ffe.png) pip install flash-attn 是出了名的慢 ![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/b47069d96473408ca2d0f5a920fa443d.png) 因为 flash-attn 包含大量的底层 CUDA 内核代码。当你执行这条命令时,你的机器正在: 调用你刚装好的 nvcc 编译器。 针对你的显卡架构,现场把几万行 C++/CUDA 代码编译成二进制。 这个过程极度消耗 CPU 和内存。 pip install https://github.com/Dao-AILab/flash-attention/releases/download/v2.7.0.post2/flash_attn-2.7.0.post2+cu124torch2.4cxx11abiFalse-cp310-cp310-linux_x86_64.whl ---上海的机器似乎有github墙 PyTorch 版本需要慎重考虑。如果选择太新的话,配套包跟不上。

相关推荐
byoass12 小时前
csdn_upload_005
网络·安全·云计算
祖传F8714 小时前
quickbi数据集数据查询时间字段显示正确,仪表板不显示
数据库·sql·阿里云
小夏子_riotous14 小时前
openstack的使用——9. 密钥管理服务Barbican
linux·运维·服务器·系统架构·centos·云计算·openstack
Aray123418 小时前
论秒杀场景及其技术解决方案
云计算
腾讯蓝鲸智云1 天前
提升研发效能:DevOps平台高效权限配置与同步方案
运维·服务器·人工智能·云计算·devops
黑牛儿1 天前
从旧版到 v0.20.5:Ollama 升级避坑全流程(附命令复制即用)
ai·云计算
刘~浪地球1 天前
架构设计--事件驱动架构设计与实现(05)
云原生·系统架构·云计算
Luke~1 天前
阿里云计算巢已上架!3分钟部署 Loki AI 事故分析引擎,SRE 复盘时间直接砍掉 80%
人工智能·阿里云·云计算·loki·devops·aiops·sre
Database_Cool_1 天前
基于PolarDB Mem0 为 OpenClaw 构建高效记忆系统(阿里云开发者)
阿里云·云计算