文生视频(Text-to-Video)

  • 🕒 生成时间:每张图大概 10--60 秒(取决于设备)

✅ 二、文生视频(Text-to-Video)

以下项目中,很多都基于 SD 模型扩展,但视频生成复杂度高,生成时间一般 超过 30 秒,也正好符合你要求。

1. ModelScope's text-to-video-synthesis

  • 📦 地址:modelscope/modelscope

  • 🔬 模型:text-to-video-synthesis

  • 🎥 视频时长:2--4秒,支持中文 prompt

  • 💻 本地部署建议:至少 8GB GPU

  • 🛠️ 安装:

pip install modelscope

pip install "modelscope[multimodal]"

  • 🧪 示例代码:

    from modelscope.pipelines
    import pipeline from modelscope.utils.constant
    import Tasks
    p = pipeline(Tasks.text_to_video_synthesis, model='damo/text-to-video-synthesis') video_path = p({'text': '一个骑自行车的少年在夕阳下'})['output_video']

相关推荐
VB.Net8 分钟前
C#循序渐进
开发语言·c#
叶凡要飞9 分钟前
RTX5060Ti安装双系统ubuntu22.04各种踩坑点(黑屏,引导区修复、装驱动、server版本安装)
人工智能·python·yolo·ubuntu·机器学习·操作系统
楼田莉子11 分钟前
C++学习:C++11扩展:constexpr特性
开发语言·c++·学习
叶庭云12 分钟前
一文掌握 CodeX CLI 安装以及使用!
人工智能·openai·安装·使用教程·codex cli·编码智能体·vibe coding 终端
懒羊羊不懒@14 分钟前
Java基础语法—最小单位、及注释
java·c语言·开发语言·数据结构·学习·算法
yuluo_YX16 分钟前
VSR 项目解析
人工智能·python
ss27318 分钟前
手写Spring第4弹: Spring框架进化论:15年技术变迁:从XML配置到响应式编程的演进之路
xml·java·开发语言·后端·spring
eurotruck22 分钟前
c++贪吃蛇V1.0
开发语言·c++·贪吃蛇
cdming1 小时前
微软Win11双AI功能来袭:“AI管家”+聊天机器人重构桌面交互体验
人工智能·microsoft·机器人
Android系统攻城狮1 小时前
C++进阶之操作符重载函数operator[]:用法实例(四百三十五)
开发语言·c++