视频生成

悟乙己9 天前
人工智能·aigc·音视频·文生视频·视频生成
文生视频开源产品的一些调研(一)笔者尝试AI视频生成的几个特点:如果要生成比较合理的长视频:这里笔者有点推荐使用【星火绘镜】来试着打造分镜,首图也可以保存, 后面生成视频的功能就别用了,瘆人。
Bubbliiiing22 天前
深度学习·stable diffusion·aigc·视频生成
AIGC专栏11——EasyAnimateV2结构详解与Lora训练 最大支持768x768 144帧视频生成研究了好长时间的文生视频,EasyAnimate到了V2版本,我们将vae修改成了magvit,同时支持图片和视频的训练与预测,另外还引入了U-vit提高训练的稳定性并加快收敛。
沉迷单车的追风少年1 个月前
人工智能·aigc·扩散模型·图像生成·视频生成
每日AIGC最新进展(10):符号音乐生成SYMPLEX、新型图像编辑数据集ReasonPix2Pix、角色一致性插画生成、高级的风格个性化扩散模型Diffusion Models专栏文章汇总:入门与实战http://arxiv.org/abs/2405.12666v1
沉迷单车的追风少年2 个月前
人工智能·aigc·扩散模型·视频编辑·视频生成
详细解读字节跳动视频生成模型StoryDiffusion:连环画创作和长视频生成Diffusion Models专栏文章汇总:入门与实战前言:最近字节跳动提出了一项关于特征一致图像生成的工作StoryDiffusion,可以生成一系列特征主题相关的图像,还可以扩展成具有时间一致性的帧序列,从而组成长视频。这篇博客火速解读这篇最新的工作,包括论文和代码。
uncle_ll2 个月前
生成对抗网络·stable diffusion·视频生成
视频生成技术:从GAN到Latte
Bubbliiiing2 个月前
aigc·文生视频·视频生成·sora·easyanimate
AIGC专栏10——EasyAnimate 一个新的类SORA文生视频模型 轻松文生视频在过年期间,OpenAI放出了SORA文生视频的预览效果,一瞬间各大媒体争相报道,又引爆了一次科技圈,可惜的是,SORA依然没选择开源。
知来者逆3 个月前
人工智能·深度学习·视频·视频生成·图像转视频·i2v
Follow-Your-Click——点选图像任意区域对象使用短提示语即可生成视频“I2V”(图像到视频生成)旨在将静态图像转换为具有合理动作的动态视频剪辑,在电影制作、增强现实和自动广告等领域有广泛应用。然而,现有的I2V方法存在一些问题,例如缺乏对图像中需要移动的部分的精准控制,生成的视频整体场景移动,以及数据集忽视物体运动等。
沉迷单车的追风少年3 个月前
人工智能·aigc·视频编辑·视频生成
CVPR 2024中有哪些值得关注的视频生成和视频编辑方向的论文?Diffusion Models视频生成-博客汇总前言:轰轰烈烈的CVPR 2024所有accept paper已经全部公开,随着Sora的爆火,视频生成和视频编辑是目前计算机视觉最火热的方向,受到了很多人的关注。这篇博客就整理盘点一下有哪些值得关注的视频生成和视频编辑方向的论文?值得做这个方向的小伙伴收藏学习。
Kobaayyy4 个月前
计算机视觉·aigc·cvpr·图像生成·视频生成·cvpr2024
CVPR2024|AIGC(图像生成,视频生成等)相关论文汇总(附论文链接/开源代码/解析)【持续更新】A Collection of Papers and Codes for CVPR2024 AIGC整理汇总下今年CVPR AIGC相关的论文和代码,具体如下。
deephub4 个月前
深度学习·大语言模型·llama·视频生成·基础模型
视频生成领域的发展概述:从多级扩散到LLM2023年是语言模型(llm)和图像生成技术激增的一年,但是视频生成受到的关注相对较少。今年刚到2月份,OpenAI就发布了一个惊人的视频生成模型Sora。虽然它的架构没有披露,但是通过总结现有的视频生成领域可能能对Sora的构架有所理解。
v_JULY_v4 个月前
视频生成·扩散transformer·vivit·dit·videopoet·openai sora
OpenAI视频生成模型Sora的全面解析:从ViViT、扩散Transformer到NaViT、VideoPoet真没想到,距离视频生成上一轮的集中爆发(详见《视频生成发展史:从Gen2、Emu Video到PixelDance、SVD、Pika 1.0、W.A.L.T》)才过去三个月,没想OpenAI一出手,该领域又直接变天了
AI算法-图哥5 个月前
人工智能·深度学习·aigc·文生图·视频生成
MagicVideo-V2:多阶段高保真视频生成框架本项工作介绍了MagicVideo-V2,将文本到图像模型、视频运动生成器、参考图像embedding模块和帧内插模块集成到端到端的视频生成流程中。由于这些架构设计的好处,MagicVideo-V2能够生成具有极高保真度和流畅度的美观高分辨率视频。通过大规模用户评估,它在性能上表现优越,超过了领先的文本到视频系统,如Runway、Pika-1.0、Morph、Moon Valley和Stable Video Diffusion模型。
曾小蛙5 个月前
aigc·ai绘画·svd·diffusion·comfyui·视频生成·stable video
【SVD生成视频+可本地部署】ComfyUI使用(二)——使用Stable Video Diffusion生成视频 (2023.11开源)SVD官方主页 : Huggingface | | Stability.ai || 论文地址 huggingface在线运行demo : https://huggingface.co/spaces/multimodalart/stable-video-diffusion SVD开源代码:Github(含其他项目) || Huggingface 在Comfyui使用: ComfyUI国内下载 | SVD模型下载 | | 官网下载(Github)
jcLee957 个月前
3d·视频生成·pika
笔记:Pika Labs 3D 动画生成工具本文地址:https://blog.csdn.net/qq_28550263/article/details/134657306
常鸿宇7 个月前
stable diffusion·多模态·生成模型·视频生成
多模态——使用stable-video-diffusion将图片生成视频近期,stabilityAI发布了一个新的项目,是将图片作为基础,生成一个相关的小视频,其实也算是其之前研究内容的扩展。早在stable-diffusion的模型开源出来的时候,除了由prompt生成图片之外,也可以生成连续帧的短视频。
Bubbliiiing8 个月前
stable diffusion·aigc·easyphoto·视频生成·ai写真
AIGC专栏8——EasyPhoto 视频领域拓展-让AIGC肖像动起来图像的AI写真是AI人像的初步应用,如何让图像动起来,形成一段视频,是AI写真领域的重要应用方向拓展。
CV518 个月前
人工智能·计算机视觉·多模态·语义分割·3d目标检测·领域泛化·视频生成
CV计算机视觉每日开源代码Paper with code速览-2023.10.30精华置顶墙裂推荐!小白如何1个月系统学习CV核心知识:链接点击@CV计算机视觉,关注更多CV干货论文已打包,点击进入—>下载界面