文生视频(Text-to-Video)

  • 🕒 生成时间:每张图大概 10--60 秒(取决于设备)

✅ 二、文生视频(Text-to-Video)

以下项目中,很多都基于 SD 模型扩展,但视频生成复杂度高,生成时间一般 超过 30 秒,也正好符合你要求。

1. ModelScope's text-to-video-synthesis

  • 📦 地址:modelscope/modelscope

  • 🔬 模型:text-to-video-synthesis

  • 🎥 视频时长:2--4秒,支持中文 prompt

  • 💻 本地部署建议:至少 8GB GPU

  • 🛠️ 安装:

pip install modelscope

pip install "modelscope[multimodal]"

  • 🧪 示例代码:

    from modelscope.pipelines
    import pipeline from modelscope.utils.constant
    import Tasks
    p = pipeline(Tasks.text_to_video_synthesis, model='damo/text-to-video-synthesis') video_path = p({'text': '一个骑自行车的少年在夕阳下'})['output_video']

相关推荐
杀生丸学AI7 分钟前
【物理重建】SPLART:基于3D高斯泼溅的铰链估计与部件级重建
3d·aigc·三维重建·视觉大模型·世界模型·空间智能·动态重建
Sim time9 分钟前
用AI从0开始量化交易-Anaconda环境(env)和缓存(pkg)更改储存位置
人工智能·python·conda
知识趣动15 分钟前
AI入门启航:看见知识库的运行原理
人工智能
灵声讯18 分钟前
开天社交大模型从7B到32B:趣丸科技如何以“情感浓度”破局AI社交体验
人工智能·科技·语言模型
墨风如雪23 分钟前
昆仑万维扔出王炸:32B模型干翻671B,代码界迎来全能修理工!
aigc
struggle202525 分钟前
torchmd-net开源程序是训练神经网络潜力
c++·人工智能·python·深度学习·神经网络
xuanzdhc27 分钟前
C++重点知识详解(命名空间,缺省参数,函数重载)
开发语言·c++
夜松云31 分钟前
GoogLeNet:图像分类神经网络的深度剖析与实践
图像处理·人工智能·神经网络·分类·数据挖掘·卷积神经网络·分类算法
软件开发技术深度爱好者35 分钟前
python中学物理实验模拟:凸透镜成像和凹透镜成像
开发语言·python
小猫咪怎么会有坏心思呢1 小时前
华为OD机试-云短信平台优惠活动-完全背包(JAVA 2024E卷)
java·开发语言·华为od