阿里云通义万相视频生成大模型开发训练部署

与阿里云一起

轻松实现数智化

让算力成为公共服务:用大规模的通用计算,帮助客户做从前不能做的事情,做从前做不到的规模。让数据成为生产资料:用数据的实时在线,帮助客户以数据为中心改变生产生活方式创造新的价值。

模型介绍

SOTA 性能:Wan2.1 在多个基准测试中始终优于现有的开源模型和最先进的商业解决方案。

支持消费级 GPU:T2V-1.3B 模型仅需 8.19 GB 显存,使其几乎兼容所有消费级 GPU。它可以在 RTX 4090 上大约 4 分钟内生成一段 5 秒的 480P 视频(不使用量化等优化技术)。其性能甚至可以与某些闭源模型相媲美。

多种任务:Wan2.1 在文本到视频、图像到视频、视频编辑、文本到图像以及视频到音频等方面表现出色,推动了视频生成领域的发展。

视觉文本生成:Wan2.1 是首个能够生成中英文文本的视频模型,具备强大的文本生成功能,增强了其实用性。

强大的视频 VAE:Wan-VAE 具有卓越的效率和性能,可以编码和解码任意长度的 1080P 视频,并保留时间信息,是视频和图像生成的理想基础。

Model Scope安装部署

下载模型运行环境安装文件到Model Scope本地开发环境:

在Model Scope本地开发环境中安装运行环境依赖库:

使用 huggingface-cli 下载模型:

使用 modelscope-cli 下载模型:

使用单 GPU 推理执行视频生成:

使用 FSDP + xDiT USP 进行多 GPU 推理执行视频生成:

阿里云模型训练

在阿里云人工智能业务平台PAI中,查找对应规格的视频生成大模型:

在视频生成大模型的详情页面中,点击部署或者训练按钮,开始设置部署或者训练的属性参数:

在视频生成大模型的训练的属性参数设置页面中,设置完成,点击训练按钮,开始执行模型训练:

阿里云模型部署

在视频生成大模型的部署的属性参数设置页面中,设置完成,点击部署按钮,开始执行模型部署:

相关推荐
Inhand陈工14 天前
基于台达PLC与映翰通IG502的智慧水产养殖精准投喂与远程运维解决方案
运维·人工智能·物联网·阿里云·信息与通信
Database_Cool_14 天前
什么是数据仓库物化视图?AnalyticDB MySQL 实时物化视图能力解析
人工智能·mysql·阿里云
Database_Cool_14 天前
大规模数据分析降本指南:AnalyticDB Serverless 弹性架构实战
数据仓库·阿里云·架构·数据分析·serverless
我是小bā吖15 天前
Claude Code 模型接入阿里云 AI 网关并统计不同使用者的模型用量
网络·人工智能·阿里云
翼龙云_cloud15 天前
阿里云国际代理商:如何使用RDS MySQL 构建网站数据库?
数据库·mysql·阿里云
wcy1008615 天前
为 CentOS 7.6 (7.6.1810) 配置阿里云 Vault 源
linux·阿里云·centos
Inhand陈工15 天前
污水泵站PLC数据上云实战:西门子PLC + 映翰通IG502 + DM平台全流程
人工智能·物联网·网络安全·阿里云·信息与通信·iot
翼龙云_cloud16 天前
阿里云代理商:如何管理CPFS的POSIX客户端挂载点?
运维·阿里云·云计算·阿里云 cpfs
AI原来如此16 天前
阿里云百炼上线DeepSeek,OpenAI发布GPT-5.5,模型服务战升级
人工智能·gpt·阿里云·ai·大模型·ai编程
啦啦啦~~~33016 天前
【办公软件】开源的PDF合并分割工具!支持PDF拆分、合并、交替混合、页面旋转、提取页面等
阿里云·pdf·电脑·开源软件