AI 视频 | Stable Video Diffusion 来了!(附体验地址)

11 月 21 日,Stability AI 推出了 Stable Video Diffusion,这是 Stability AI 的第一个基于图像模型 Stable Diffusion 的生成式视频基础模型。

目前 Stability AI 已经在 GitHub 上开源了 Stable Video Diffusion 的代码,在 Hugging Face 上也可以找到模型本地运行所需要的 weights。

GitHub

github.com/Stability-A...

Hugging Face

huggingface.co/stabilityai...

目前该视频模型可以很容易地适配下游各种任务,并计划基于此基础模型建立一系列模型,类似于围绕 stable diffusion 建立一个生态系统。

在外部评估中,Stable Video Diffusion 发布的两种图片生视频的模型 SVD 和 SVD-XT,在用户偏好研究中,已经超过了 Runway 和 Pika Labs。

需要注意的是:

1、Stability AI 强调,此模型现阶段还不适用于实际或者商业应用。

2、网页的体验目前还未向所有人开放,可以在这里申请候补(stability.ai/contact)

另外,stable-video-diffusion-img2vid-xt 还有一些局限性,在 Hugging Face 上也说明了,该模型仅用于研究目的。

局限性

1、生成的视频相当短(<=4秒),并且该模型无法实现完美的照片级别的视频。

2、当前模型可能会生成没有运动的视频,或非常缓慢的相机平移的视频。

3、无法通过文本控制模型。

4、模型无法呈现清晰的文本。

5、面孔和人物可能无法正确生成。

6、模型的自编码部分是有损耗的。

如何体验

Hugging Face 上的体验地址:huggingface.co/spaces/mult...

不过上传图片点生成后,提示「This application is too busy」。

后来看到国外一位大佬的分享:colab.research.google.com/github/mksh...

打开链接后,点击「代码执行程序」-「全部运行」就可以了,过程有点慢,感兴趣的小伙伴可以跑一下~

关于 Stable Video Diffusion 更多详细的介绍,可以查看论文:stability.ai/research/st...

参考网址

stability.ai/news/stable...

相关推荐
郝学胜-神的一滴16 小时前
B站:从二次元到AI创新孵化器的华丽转身 | Google Cloud峰会见闻
开发语言·人工智能·算法
千流出海16 小时前
冬季风暴考验因AI数据中心而紧张的电网系统
人工智能
安科瑞小许16 小时前
能碳管理平台:园区绿色转型的“智慧中枢”
大数据·人工智能·信息可视化·能源·双碳·光伏·零碳园区
AC赳赳老秦16 小时前
R语言数据分析:DeepSeek辅助生成统计建模代码与可视化图表
开发语言·人工智能·jmeter·数据挖掘·数据分析·r语言·deepseek
算法&大模型备案-考拉16 小时前
算法备案中不按要求履行算法备案服务会怎样?
人工智能·aigc·算法备案·不做算法备案会怎样·深度合成服务算法备案·深度合成算法备案·不做算法备案的处罚
雄狮少年16 小时前
AI Agent Workflow基类及实现类,快速实现一个react agent,可直接运行
人工智能·windows·react.js
Momentary_SixthSense16 小时前
一篇文章讲清Function Calling、Mcp、Agent
人工智能
StarChainTech16 小时前
打造火爆的线上推币机APP:一站式合规娱乐解决方案
大数据·人工智能·物联网·小程序·娱乐·软件需求·共享经济
老兵发新帖16 小时前
Clawdbot skills与Claude skills对比分析
人工智能
sali-tec16 小时前
C# 基于OpenCv的视觉工作流-章18-图像缩放
图像处理·人工智能·opencv·算法·计算机视觉