推荐轻量级文生视频模型(Text-to-Video)

1. ModelScope T2V by 阿里达摩院(推荐)

  • 模型名damo/text-to-video-synthesis

  • 输入:一句文字描述(如:"a panda is dancing")

  • 输出:2秒视频(16帧,576x320 分辨率)

  • 显卡推荐:8GB~16GB 显存(支持 CPU fallback)

  • 生成时间:约 40~120 秒(满足你的要求)

  • 优点

    • 真正文生视频(非插帧)

    • HuggingFace + ModelScope CLI 接口友好

  • 开源地址

  • 使用方式(简化):

    复制代码

    pip install modelscope python -m modelscope.cli inference \ --model damo/text-to-video-synthesis \ --text "A dog running in the park"

相关推荐
智算菩萨1 分钟前
自然语言处理常用Python库:spaCy使用全解
人工智能·python·自然语言处理
deephub6 分钟前
ONNX Runtime Python 推理性能优化:8 个低延迟工程实践
开发语言·人工智能·python·神经网络·性能优化·onnx
大模型实验室Lab4AI7 分钟前
Qwen-Video-8B与LLaMA-Factory联动实现垂类视频理解
人工智能·音视频·llama
لا معنى له5 小时前
目标检测的内涵、发展和经典模型--学习笔记
人工智能·笔记·深度学习·学习·目标检测·机器学习
Robot侠8 小时前
极简LLM入门指南4
大数据·python·llm·prompt·提示工程
等....9 小时前
Miniconda使用
开发语言·python
Java&Develop9 小时前
Aes加密 GCM java
java·开发语言·python
爱笑的眼睛1111 小时前
超越MSE与交叉熵:深度解析损失函数的动态本质与高阶设计
java·人工智能·python·ai
Coding茶水间11 小时前
基于深度学习的非机动车头盔检测系统演示与介绍(YOLOv12/v11/v8/v5模型+Pyqt5界面+训练代码+数据集)
图像处理·人工智能·深度学习·yolo·目标检测·机器学习·计算机视觉
Rose sait12 小时前
【环境配置】Linux配置虚拟环境pytorch
linux·人工智能·python