文生视频(Text-to-Video)

  • 🕒 生成时间:每张图大概 10--60 秒(取决于设备)

✅ 二、文生视频(Text-to-Video)

以下项目中,很多都基于 SD 模型扩展,但视频生成复杂度高,生成时间一般 超过 30 秒,也正好符合你要求。

1. ModelScope's text-to-video-synthesis

  • 📦 地址:modelscope/modelscope

  • 🔬 模型:text-to-video-synthesis

  • 🎥 视频时长:2--4秒,支持中文 prompt

  • 💻 本地部署建议:至少 8GB GPU

  • 🛠️ 安装:

pip install modelscope

pip install "modelscope[multimodal]"

  • 🧪 示例代码:

    from modelscope.pipelines
    import pipeline from modelscope.utils.constant
    import Tasks
    p = pipeline(Tasks.text_to_video_synthesis, model='damo/text-to-video-synthesis') video_path = p({'text': '一个骑自行车的少年在夕阳下'})['output_video']

相关推荐
一口面条一口蒜13 分钟前
R语言中的S3 泛型与方法
开发语言·r语言
央链知播16 分钟前
王玉真:可信资产与数链金融的核心根基——构建全链路可信信用体系
人工智能·金融·重构·web3·区块链·业界资讯
路人与大师21 分钟前
AI Agent的演进之路:从检索增强到世界模型的六代变革
人工智能
szxinmai主板定制专家23 分钟前
ZYNQ 平台下的四声道超声流量计设计与实现
运维·arm开发·人工智能·分布式·fpga开发
_OP_CHEN25 分钟前
C++基础:(五)类和对象(下)—— static、友元和内部类
开发语言·c++·构造函数·static成员·友元·匿名对象·编译器优化
databook26 分钟前
Manim实现闪电特效
后端·python·动效
码猩28 分钟前
YOLO通用无人机目标检测框架
人工智能·yolo·目标检测
yongui4783431 分钟前
基于MATLAB的8QAM调制解调仿真与BER性能分析
开发语言·matlab
一百天成为python专家32 分钟前
机器学习之逻辑回归(梯度下降,Z标准化,0-1归一化)
人工智能·opencv·机器学习·计算机视觉·数据挖掘·数据分析·逻辑回归
koo36432 分钟前
李宏毅机器学习笔记15
人工智能·笔记·机器学习