文生视频(Text-to-Video)

  • 🕒 生成时间:每张图大概 10--60 秒(取决于设备)

✅ 二、文生视频(Text-to-Video)

以下项目中,很多都基于 SD 模型扩展,但视频生成复杂度高,生成时间一般 超过 30 秒,也正好符合你要求。

1. ModelScope's text-to-video-synthesis

  • 📦 地址:modelscope/modelscope

  • 🔬 模型:text-to-video-synthesis

  • 🎥 视频时长:2--4秒,支持中文 prompt

  • 💻 本地部署建议:至少 8GB GPU

  • 🛠️ 安装:

pip install modelscope

pip install "modelscope[multimodal]"

  • 🧪 示例代码:

    from modelscope.pipelines
    import pipeline from modelscope.utils.constant
    import Tasks
    p = pipeline(Tasks.text_to_video_synthesis, model='damo/text-to-video-synthesis') video_path = p({'text': '一个骑自行车的少年在夕阳下'})['output_video']

相关推荐
测试员周周19 小时前
【Appium 系列】第16节-WebView-H5上下文切换 — 混合应用的自动化难点
运维·开发语言·人工智能·功能测试·appium·自动化·测试用例
测试199819 小时前
软件测试 - 单元测试总结
自动化测试·软件测试·python·测试工具·职场和发展·单元测试·测试用例
K姐研究社21 小时前
怎么用AI制作电商口播视频,开拍APP一键生成
人工智能·音视频
LaughingZhu21 小时前
Product Hunt 每日热榜 | 2026-05-21
前端·人工智能·经验分享·chatgpt·html
曲幽1 天前
我用了FastApiAdmin后,连夜把踩过的坑都整理出来了
redis·python·postgresql·vue3·fastapi·web·sqlalchemy·admin·fastapiadmin
杜子不疼.1 天前
【C++ AI 大模型接入 SDK】 - DeepSeek 模型接入(上)
开发语言·c++·chatgpt
加号31 天前
【C#】 串口通信技术深度解析及实现
开发语言·c#
传说故事1 天前
【论文阅读】MotuBrain: An Advanced World Action Model for Robot Control
论文阅读·人工智能·具身智能·wam
北京耐用通信1 天前
全域适配工业场景耐达讯自动化Modbus TCP 转 PROFIBUS 网关轻松实现以太网与现场总线互通
网络·人工智能·网络协议·自动化·信息与通信
火山引擎开发者社区1 天前
TRAE × 火山引擎 Supabase:为你的 AI 应用装上“数据引擎”
人工智能