推荐轻量级文生视频模型(Text-to-Video)

1. ModelScope T2V by 阿里达摩院(推荐)

  • 模型名damo/text-to-video-synthesis

  • 输入:一句文字描述(如:"a panda is dancing")

  • 输出:2秒视频(16帧,576x320 分辨率)

  • 显卡推荐:8GB~16GB 显存(支持 CPU fallback)

  • 生成时间:约 40~120 秒(满足你的要求)

  • 优点

    • 真正文生视频(非插帧)

    • HuggingFace + ModelScope CLI 接口友好

  • 开源地址

  • 使用方式(简化):

    复制代码

    pip install modelscope python -m modelscope.cli inference \ --model damo/text-to-video-synthesis \ --text "A dog running in the park"

相关推荐
财经资讯数据_灵砚智能1 天前
基于全球经济类多源新闻的NLP情感分析与数据可视化(日间)2026年5月21日
大数据·人工智能·python·信息可视化·自然语言处理
大模型最新论文速读1 天前
05-21 · LLM 最新论文速览
论文阅读·人工智能·深度学习·机器学习·自然语言处理
初心未改HD1 天前
深度学习之RNN循环神经网络详解
人工智能·rnn·深度学习
Artech1 天前
[对比学习LangChain和MAF-03]完全不同的Agent设计哲学
python·ai·langchain·c#·agent·maf
koharu1231 天前
PointRCNN 精解:从原始点云到三维框的两阶段检测
人工智能·深度学习·目标检测·3d·三维点云
诸葛老刘1 天前
国密python调java服务
java·python·国密·sm2
Omics Pro1 天前
免费!糖蛋白质组学数据分析
开发语言·深度学习·数据挖掘·数据分析·r语言·excel·知识图谱
WL_Aurora1 天前
Python 算法基础篇之排序算法(二):希尔、快速、归并
python·算法·排序算法
chao1898441 天前
基于MATLAB的音频信号AM调制与解调实现
开发语言·matlab·音视频
MediaTea1 天前
DL:深度学习的主要任务
人工智能·深度学习