文生视频(Text-to-Video)

  • 🕒 生成时间:每张图大概 10--60 秒(取决于设备)

✅ 二、文生视频(Text-to-Video)

以下项目中,很多都基于 SD 模型扩展,但视频生成复杂度高,生成时间一般 超过 30 秒,也正好符合你要求。

1. ModelScope's text-to-video-synthesis

  • 📦 地址:modelscope/modelscope

  • 🔬 模型:text-to-video-synthesis

  • 🎥 视频时长:2--4秒,支持中文 prompt

  • 💻 本地部署建议:至少 8GB GPU

  • 🛠️ 安装:

pip install modelscope

pip install "modelscope[multimodal]"

  • 🧪 示例代码:

    from modelscope.pipelines
    import pipeline from modelscope.utils.constant
    import Tasks
    p = pipeline(Tasks.text_to_video_synthesis, model='damo/text-to-video-synthesis') video_path = p({'text': '一个骑自行车的少年在夕阳下'})['output_video']

相关推荐
lsx20240611 分钟前
Rust 迭代器
开发语言
心勤则明14 分钟前
用 Spring AI Alibaba 打造智能查询增强引擎
java·人工智能·spring
阿贵---17 分钟前
C++中的备忘录模式
开发语言·c++·算法
房开民22 分钟前
paddle 文本检测识别模型转为onnx
开发语言·r语言·paddle
wh_xia_jun31 分钟前
MODNet 本地抠图项目指南
python
setmoon21433 分钟前
C++中的观察者模式实战
开发语言·c++·算法
2403_8355684735 分钟前
C++代码规范化工具
开发语言·c++·算法
njsgcs39 分钟前
图卷积是如何处理不同输入长度的 消息传递
人工智能
哥本哈士奇1 小时前
使用OpenClaw的Skills对接本地系统
人工智能
IT_陈寒1 小时前
SpringBoot实战:3个隐藏技巧让你的应用性能飙升50%
前端·人工智能·后端