LatentSync 开源数字人视频对口型 懒人整合包

LatentSync

github地址:github.com/bytedance/L...

LatentSync ‌ 是开源唇形同步(Lip Sync)框架,基于 ‌**Stable Diffusion潜在扩散模型**‌,实现从音频到高分辨率视频唇部运动的端到端生成。它无需依赖中间运动表示(如 2D 特征点或 3D 人脸模型),直接在潜在空间中建模音频与视觉的跨模态关联,显著提升生成质量与效率。

核心特点

  • ‌**端到端架构**‌:输入音频,直接输出与之同步的唇部视频帧,简化传统多阶段流程。
  • 高分辨率支持 ‌:支持最高 ‌512×512‌ 分辨率视频生成,1.6 版本已大幅改善模糊问题。
  • 低显存需求 ‌:1.6 版本最低仅需 ‌8GB 显存‌,可在消费级 GPU 上运行。
  • 多语言优化‌:特别针对中文语音处理效果进行优化。
  • 广泛适用性‌:支持真人视频、动漫角色、虚拟主播等多种应用场景

本文懒人包为1.5版本

点击启动程序.bat,会弹出一个终端

等待终端执行加载,会自动弹出webui网页

选择视频,和选择对应的语音文件,点击生成视频

终端可以看到处理进度生成后右侧有视频结果,可以预览和下载

Tips

点击此处 网盘下载

建议显存8GB及以上使用

已开启送

相关推荐
爱吃的小肥羊1 小时前
又搞事情,OpenAI 开始关闭微调服务!
aigc·openai
imbackneverdie1 小时前
一天怎么完成论文初稿
人工智能·自然语言处理·aigc·ai写作·论文写作·论文投稿·科研工具
用户5191495848452 小时前
图片上传绕过与存储型XSS漏洞利用技术详解
人工智能·aigc
AI先驱体验官2 小时前
臻灵短剧平台 · 用户操作手册
大数据·人工智能·深度学习·重构·aigc
Filwaod2 小时前
Java面试:AIGC场景下的技术深度拷问-谢飞机篇
spring boot·缓存·微服务·消息队列·aigc·java面试·ai技术
92year7 小时前
FastMCP 实战——从本地 stdio 到生产级 HTTP + 鉴权 + 后台任务
aigc
算力百科小智8 小时前
手机漫剧 App 与电脑平台对比哪个更强
aigc
captain_AIouo8 小时前
Captain AI全功能矩阵覆盖OZON运营每一个关键节点
大数据·人工智能·经验分享·矩阵·aigc
Pkmer9 小时前
深度优先遍历遇上 AI:用 LangChain Agent 实现 26 个字母的趣味自我介绍
langchain·aigc
DigitalOcean9 小时前
AI 推理引擎四大模式:无服务推理、专用推理、批量推理与智能路由,怎么选?
llm·aigc·agent