InfiniteTalk V2版 - 声音驱动图片生成高度逼真的说话/唱歌视频 支持50系显卡 ComfyUI+WebUI 一键整合包下载

InfiniteTalk 是一个能根据音频生成无限时长人物说话/唱歌视频的AI模型,无论是给现有视频配音,还是让静态图片"开口说话",还是让人物图片"唱歌",它都能实现精准的唇形同步和自然的肢体动作。

今天分享的 InfiniteTalk V2版 ,基于上个版本 的工作流更新升级,新增了适合新手小白操作的WebUI,如果是使用ComfyUI且下载过上个ComfyUI的老司机,无需下载这个版本。WebUI支持自定义切换Wan主模型和InfiniteTalk 模型,网盘自带Q4和Q8两个版本,大家根据自己的显卡切换。当前WebUI只支持单人生成,下个版本会集成双人版。

下载地址:点此下载

核心特点 ‌

全维度同步‌

不仅唇形与音频匹配,还会自动生成对应的‌头部转动、身体姿态和面部表情‌,让虚拟人物更生动。

传统配音工具只调整嘴唇,而InfiniteTalk连肢体语言一起模拟。

无限时长生成‌

支持超长视频生成(如1小时以上),通过分段处理技术保证连贯性。

普通AI视频模型通常限制在几十秒内。

双模式输入‌ ‌

视频+音频‌:给现有视频换配音(如翻译配音、内容修改)。 ‌

图片+音频‌:让一张静态照片"开口说话"(如虚拟主播、教育视频)。

高稳定性‌

相比同类模型(如MultiTalk),显著减少了手部扭曲和身体变形的问题。

多分辨率支持‌

兼容480P和720P,可根据设备性能选择清晰度。

应用领域

‌影视娱乐‌:电影配音、短视频角色配音、虚拟偶像直播 ‌

数字人生成:一键生成数字人视频,助力小白进军自媒体

教育科普‌:定制化教学视频、历史人物"亲口"讲解 ‌

商业宣传‌:品牌虚拟代言人自动生成多语言宣传片 ‌

社交娱乐‌:让自拍照片念台词、生成个性化生日祝福视频

使用教程: (建议N卡,显存8G起,建议cuda≥12.8)

整合包包含所需所有节点,下载主程序和模型(ComfyUI文件夹即为模型),解压主程序一键包,将ComfyUI文件夹移动到主程序目录下即可。

ComfyUI模式

双击启动ComfyUI,进入页面后,点击左侧的 工作流,选择对应的工作流(包含单人+多人+视频驱动视频三种模式),根据需要选择。上传需要生成的人物图片和音频文件,设置相关参数,运行即可。ComfyUI模式,建议专业人士使用,小白可以使用下面的WebUI模式。

WebUI模式

双击启动WebUI,进入页面后,上传需要生成的人物图像和音频文件,设置相关参数,生成即可。

这里说下几个参数,显卡好的,可以下载精度更高的模型,比如 Wan 视频模型 和 InfiniteTalk 模型;加速模式这个参数,默认开启sag加速,如果卡在采样报错,请切换至sdpa或者手动 安装vc编译器;交换块大小默认是20,如果显卡好,比如4090或5090等,可以改成40。

InfiniteTalk 模型可以根据显卡选择,显存8G的可以切换到Q4版,显存≥12G的,建议使用Q8版。其他版本可以 移步此链接 ,下载后,放到ComfyUI\models\diffusion_models 目录,网页端切换即可。

相关推荐
cjqbg19 分钟前
灵芽API:企业级大模型API聚合网关架构解析与成本效益对比
人工智能·架构·aigc·ai编程
人工智能培训23 分钟前
数字孪生应用于特种设备领域的技术难点
人工智能·机器学习·语言模型·数字孪生·大模型幻觉·数字孪生应用
慧一居士26 分钟前
OpenAI 和OpenApi 区别对比和关系
人工智能
资讯雷达31 分钟前
2026 年,GEO 优化如何选?风信子传媒:以“内容生态+智能分发”重塑品牌 AI 认知
大数据·人工智能·传媒
中科天工1 小时前
当智能包装行业迎来新机遇,如何驾驭发展趋势?
大数据·人工智能·智能
BBTSOH159015160441 小时前
VR每日热点简报2026.1.23
人工智能·vr·人形机器人·动作捕捉·机械手·遥操作·数据手套
快降重科研小助手1 小时前
文科论述深度改写|挑战哲学论述文,“快降重”如何应对思辨文本?
人工智能·经验分享·aigc·ai写作·降重·降ai率
wan9zhixin1 小时前
2026年1月变电设备六氟化硫泄漏检测仪品牌推荐
大数据·网络·人工智能
bst@微胖子1 小时前
LlamaIndex之Workflow工作流案例
人工智能·机器学习
栗少2 小时前
雅思口语高分进阶:从“中式表达”到“母语者逻辑”的深度重构
人工智能