推荐轻量级文生视频模型(Text-to-Video)

1. ModelScope T2V by 阿里达摩院(推荐)

  • 模型名damo/text-to-video-synthesis

  • 输入:一句文字描述(如:"a panda is dancing")

  • 输出:2秒视频(16帧,576x320 分辨率)

  • 显卡推荐:8GB~16GB 显存(支持 CPU fallback)

  • 生成时间:约 40~120 秒(满足你的要求)

  • 优点

    • 真正文生视频(非插帧)

    • HuggingFace + ModelScope CLI 接口友好

  • 开源地址

  • 使用方式(简化):

    复制代码

    pip install modelscope python -m modelscope.cli inference \ --model damo/text-to-video-synthesis \ --text "A dog running in the park"

相关推荐
lingchen19063 小时前
卷积神经网络中的卷积运算原理
深度学习·计算机视觉·cnn
AI视觉网奇3 小时前
pycharm 默认终端设置 cmd
ide·python·pycharm
言之。3 小时前
LiteLLM:让LLM调用变得简单统一
后端·python·flask
ZhengEnCi4 小时前
Python_try-except-finally 完全指南-从异常处理到程序稳定的 Python 编程利器
后端·python
jarreyer4 小时前
常见分析方法与对应图表汇总
python·信息可视化·数据分析
m0_64880493_江哥4 小时前
用正则方法从中英文本提取英文的python示例
python·mysql·正则表达式
N0nename4 小时前
TR3--Transformer之pytorch复现
人工智能·pytorch·python
Full Stack Developme4 小时前
jdk.random 包详解
java·开发语言·python
m***记5 小时前
Python 数据分析入门:Pandas vs NumPy 全方位对比
python·数据分析·pandas
MYX_3095 小时前
第七章 完整的模型训练
pytorch·python·深度学习·学习