视频生成

ScienceLi11253 天前
微调·扩散模型·视频生成
Tune-A-Video:使用图像扩散模型进行一次微调实现文本到视频的生成Paper: Wu J Z, Ge Y, Wang X, et al. Tune-a-video: One-shot tuning of image diffusion models for text-to-video generation[C]//Proceedings of the IEEE/CVF International Conference on Computer Vision. 2023: 7623-7633. Introduction: https://tuneavideo.github.
小白狮ww5 天前
图像处理·人工智能·深度学习·机器学习·音视频·视频生成·ai 视频
LTX-Video 高效视频生成模型,一键处理图片&文字LTX-Video 是由 Lightricks 在 2024 年开发的一种视频生成模型,这种模型采用了 transformer 和 Video-VAE 技术,能够高效生成高分辨率视频。此外,LTX-Video 支持多种视频生成方式,包括从文本到视频和从图像到视频。
杀生丸学AI7 天前
人工智能·大模型·aigc·文生视频·svd·扩散模型·视频生成
【AIGC】SYNCAMMASTER:多视角多像机的视频生成标题:SYNCAMMASTER: SYNCHRONIZING MULTI-CAMERA VIDEO GENERATION FROM DIVERSE VIEWPOINTS 主页:https://jianhongbai.github.io/SynCamMaster/ 代码:https://github.com/KwaiVGI/SynCamMaster
Struart_R7 天前
人工智能·计算机视觉·3d·风格迁移·扩散模型·视频生成·3dgs
StyleGaussian: Instant 3D Style Transferwith Gaussian Splatting 论文解读目录一、概述二、相关工作1、辐射场2、3D编辑3、风格迁移三、StyleGaussian1、特征嵌入2、风格迁移
AI生成未来13 天前
视频编辑·视频生成
视频编辑最新SOTA!港中文&Adobe等发布统一视频生成传播框架——GenProp文章链接:https://arxiv.org/pdf/2412.19761 项目链接:https://genprop.github.io
Struart_R14 天前
人工智能·深度学习·计算机视觉·3d·transformer·扩散模型·视频生成
HunyuanVideo: A Systematic Framework For LargeVideo Generative Models 论文解读目录一、概述二、相关工作三、Hunyuan Video1、总论2、数据预处理2.1数据过滤2.2数据注释
AI生成未来20 天前
图像生成·图像编辑·视频生成
NeurIPS 2024 | 像素级LLM实现图像视频理解、生成、分割和编辑大统一(昆仑万维等)Accepted by NeurIPS 2024文章链接:https://arxiv.org/pdf/2412.19806 项目链接:https://vitron-llm.github.io/ Github链接:https://github.com/SkyworkAI/Vitron
AI生成未来24 天前
视频生成·ai生成视频·文本生视频
无需训练!多提示视频生成最新SOTA!港中文&腾讯等发布DiTCtrl:基于MM-DiT架构文章链接:https://arxiv.org/pdf/2412.18597 项目链接:https://github.com/TencentARC/DiTCtrl
v_JULY_v24 天前
视频生成·扩散transformer·dit·机器人动作预测·扩散过程·改造dit·清华pad
Diffusion Transformer(DiT)——将扩散过程中的U-Net换成ViT:近频繁用于视频生成与机器人动作预测(含清华PAD详解)本文最开始属于此文《视频生成Sora的全面解析:从AI绘画、ViT到ViViT、TECO、DiT、VDT、NaViT等》
Struart_R1 个月前
人工智能·深度学习·计算机视觉·transformer·视频生成
CogVideoX: Text-to-Video Diffusion Models with An Expert Transformer 论文解读目录一、前置知识1、Cogview2、Cogview23、Cogvideo二、CogvideoX概述三、CogVideoX架构
SP FA2 个月前
人工智能·深度学习·计算机视觉·computer vision·视频生成·3d 可控视频生成
[读论文] Compositional 3D-aware Video Generation with LLM Director近年来,通过强大的生成模型和大规模互联网数据,文本到视频生成领域取得了显著进展。然而,在生成视频中精确控制单个概念(如特定角色的动作和外观、视角的移动)方面,仍存在巨大挑战。为此,我们提出了一种新的范式,先分别生成每个概念的 3D 表示,然后利用大语言模型(LLM)和 2D 扩散模型的先验知识将它们组合起来。具体来说,对于输入的文本提示,我们的方法分为三个阶段:
阿里云大数据AI技术2 个月前
人工智能·阿里云·视频生成·ai视频·easyanimate
EasyAnimateV5 视频生成大模型原理详解与模型使用在数字内容创作中,视频扮演的角色日益重要。然而,创作高质量视频通常耗时且昂贵。EasyAnimate 系列旨在利用人工智能技术简化这一过程。EasyAnimateV5 建立在其前代版本的基础之上,不仅在质量上有所提升,还在多模态数据处理和跨语言支持上有了进一步的增强。
微学AI2 个月前
人工智能·深度学习·大模型·音视频·通义千问·视频生成
AI高中数学教学视频生成技术:利用通义千问、MathGPT、视频多模态大模型,语音大模型,将4个模型融合 ,生成高中数学教学视频,并给出实施方案。大家好,我是微学AI,今天给大家介绍一下AI高中数学教学视频生成技术:利用通义千问、MathGPT、视频多模态大模型,语音大模型,将4个模型融合 ,生成高中数学教学视频,并给出实施方案。本文利用专家模型+反思+总结的模式提升大模型返回结合,文本生成PPT模型,驱动PPT生成动画视频,并结合文稿生成语音,最后合并生成完整的高中数学教学视频。
算家云2 个月前
人工智能·深度学习·机器学习·显卡·算力·视频生成·ai视频编辑
VideoCrafter模型部署教程VideoCrafter是一个功能强大的AI视频编辑和生成工具,它结合了深度学习和机器学习技术,为用户提供了便捷的视频制作和编辑体验。
士多啤梨先生3 个月前
人工智能·开源·视频生成
Genmoai-smol:专为单 GPU 优化的开源 AI 视频生成模型,低显存生成高质量视频❤️ 如果你也关注大模型与 AI 的发展现状,且对大模型应用开发非常感兴趣,我会快速跟你分享最新的感兴趣的 AI 应用和热点信息,也会不定期分享自己的想法和开源实例,欢迎关注我哦!
AI生成未来3 个月前
零样本·视频生成·zero-shot
定制化视频生成新模范!零样本主体驱动,精确运动控制!复旦&阿里等发布DreamVideo-2文章链接:https://arxiv.org/pdf/2410.13830 项目链接:https://dreamvideo2.github.io/
算家云3 个月前
人工智能·1024程序员节·视频生成·模型搭建·算家云·算力租赁·controlnext-svd
如何在算家云搭建ControlNext-SVD(视频生成)ControlNext-SVD-V2 是 ControlNext-SVD 的 V2 模型。其中 ControlNext-SVD 模型是通过添加 ControlNet 来控制 Stable Video Diffusion (SVD),使用高分辨率视频训练,具体来说它可以将图片生成与指定姿态相匹配的高质量视频。
Slientsakke3 个月前
计算机视觉·aigc·数字人·视频生成·超分辨率
Hallo2 长视频和高分辨率的音频驱动的肖像图像动画 (数字人技术)HALLO2: LONG-DURATION AND HIGH-RESOLUTION AUDIO-DRIVEN PORTRAIT IMAGE ANIMATION
算家云3 个月前
人工智能·aigc·视频生成·算家云·video-infinity·大模型搭建·算力租赁
如何在算家云搭建Video-Infinity(视频生成)Video-Infinity是一个先进的视频生成模型,使用多个 GPU 快速生成长视频,无需额外训练。它能够基于用户提供的文本或图片提示,创造出高质量、多样化的视频内容。
算家云3 个月前
人工智能·3d·aigc·模型·视频生成·动态视觉·视频动画
champ模型部署指南champ是由阿里巴巴、复旦大学和南京大学的研究人员共同提出的一种基于3D的将人物图片转换为视频动画的模型,该方法结合了3D参数化模型(特别是SMPL模型)和潜在扩散模型,能够精确地捕捉和再现人体的3D形状和动态,同时保持动画的时间一致性和视觉真实性,以生成高质量的人类动画视频。