推荐轻量级文生视频模型(Text-to-Video)

1. ModelScope T2V by 阿里达摩院(推荐)

  • 模型名damo/text-to-video-synthesis

  • 输入:一句文字描述(如:"a panda is dancing")

  • 输出:2秒视频(16帧,576x320 分辨率)

  • 显卡推荐:8GB~16GB 显存(支持 CPU fallback)

  • 生成时间:约 40~120 秒(满足你的要求)

  • 优点

    • 真正文生视频(非插帧)

    • HuggingFace + ModelScope CLI 接口友好

  • 开源地址

  • 使用方式(简化):

    复制代码

    pip install modelscope python -m modelscope.cli inference \ --model damo/text-to-video-synthesis \ --text "A dog running in the park"

相关推荐
是紫焅呢12 分钟前
N数据分析pandas基础.py
python·青少年编程·数据挖掘·数据分析·pandas·学习方法·visual studio code
heyheyhey_18 分钟前
大模型之深度学习PyTorch篇——导学、创建、运算
人工智能·pytorch·深度学习
胖墩会武术1 小时前
Black自动格式化工具
python·格式化·black
MarkGosling1 小时前
【三维重建】VGGT:告别漫长等待,几秒解锁3D世界的CVPR黑马
深度学习·计算机视觉·图像识别
struggle20251 小时前
DIPLOMAT开源程序是基于深度学习的身份保留标记对象多动物跟踪(测试版)
人工智能·python·深度学习
有Li1 小时前
SpinFlowSim:用于癌症组织学信息驱动的扩散MRI微血管映射的血流模拟框架|文献速递-深度学习医疗AI最新文献
论文阅读·人工智能·深度学习·计算机视觉·医学生
发现你走远了1 小时前
什么是状态机?状态机入门
python·状态机
可能是猫猫人2 小时前
【Python打卡Day39】图像数据与显存 @浙大疏锦行
开发语言·python
爬虫程序猿2 小时前
利用 Python 爬虫获取 Amazon 商品详情:实战指南
开发语言·爬虫·python
aiweker3 小时前
python web开发-Flask 重定向与URL生成完全指南
前端·python·flask