推荐轻量级文生视频模型(Text-to-Video)

1. ModelScope T2V by 阿里达摩院(推荐)

  • 模型名damo/text-to-video-synthesis

  • 输入:一句文字描述(如:"a panda is dancing")

  • 输出:2秒视频(16帧,576x320 分辨率)

  • 显卡推荐:8GB~16GB 显存(支持 CPU fallback)

  • 生成时间:约 40~120 秒(满足你的要求)

  • 优点

    • 真正文生视频(非插帧)

    • HuggingFace + ModelScope CLI 接口友好

  • 开源地址

  • 使用方式(简化):

    复制代码

    pip install modelscope python -m modelscope.cli inference \ --model damo/text-to-video-synthesis \ --text "A dog running in the park"

相关推荐
麦兜*6 小时前
Spring Boot集成方案 + Elasticsearch向量检索,语义搜索核弹
java·spring boot·python·spring·elasticsearch·spring cloud·系统架构
仪器科学与传感技术博士6 小时前
python:讲懂决策树,为理解随机森林算法做准备,以示例带学习,通俗易懂,容易理解和掌握
python·算法·决策树
歪歪1006 小时前
HTML 如何转 Markdown
开发语言·chrome·python·程序人生·html
王者鳜錸7 小时前
PYTHON从入门到实践-18Django模版渲染
开发语言·python·django
l1t9 小时前
利用DeepSeek改写并增强测试Duckdb和sqlite的不同插入方法性能
python·sql·sqlite·duckdb
爷_10 小时前
用 Python 打造你的专属 IOC 容器
后端·python·架构
第六五10 小时前
大型音频语言模型论文总结
人工智能·语言模型·音视频
ID_1800790547310 小时前
python采集拍立淘按图搜索API接口,json数据参考
大数据·数据库·python·json
不是二师兄的八戒11 小时前
PDF转图片工具技术文档(命令行版本)
前端·python·pdf
Python图像识别11 小时前
03-基于深度学习的钢铁缺陷检测-yolo11-彩色版界面
人工智能·深度学习