推荐轻量级文生视频模型(Text-to-Video)

1. ModelScope T2V by 阿里达摩院(推荐)

  • 模型名damo/text-to-video-synthesis

  • 输入:一句文字描述(如:"a panda is dancing")

  • 输出:2秒视频(16帧,576x320 分辨率)

  • 显卡推荐:8GB~16GB 显存(支持 CPU fallback)

  • 生成时间:约 40~120 秒(满足你的要求)

  • 优点

    • 真正文生视频(非插帧)

    • HuggingFace + ModelScope CLI 接口友好

  • 开源地址

  • 使用方式(简化):

    复制代码

    pip install modelscope python -m modelscope.cli inference \ --model damo/text-to-video-synthesis \ --text "A dog running in the park"

相关推荐
CNRio14 小时前
人工智能基础架构与算力之3 Transformer 架构深度解析:从注意力机制到算力适配演进
人工智能·深度学习·transformer
qy-ll14 小时前
深度学习——CNN入门
人工智能·深度学习·cnn
u***324315 小时前
使用python进行PostgreSQL 数据库连接
数据库·python·postgresql
青瓷程序设计18 小时前
动物识别系统【最新版】Python+TensorFlow+Vue3+Django+人工智能+深度学习+卷积神经网络算法
人工智能·python·深度学习
tobebetter952718 小时前
How to manage python versions on windows
开发语言·windows·python
F_D_Z18 小时前
数据集相关类代码回顾理解 | sns.distplot\%matplotlib inline\sns.scatterplot
python·深度学习·matplotlib
daidaidaiyu19 小时前
一文入门 LangGraph 开发
python·ai
阿龙AI日记19 小时前
详解Transformer04:Decoder的结构
人工智能·深度学习·自然语言处理
不知更鸟20 小时前
前端报错:快速解决Django接口404问题
前端·python·django
4***721320 小时前
【玩转全栈】----Django模板语法、请求与响应
数据库·python·django