免费可用!最强AI数字人对口型神器:让照片开口说话唱歌,支持多人对口型+全身动作,1分钟学会!(附保姆级教程)

之前分享了 6 款可以「让图片说话唱歌」的 AI 对口型工具:

只要上传一张照片 + 一段音频,就能生成唇形同步的对口型视频。

全部免费!6款AI对口型神器,让照片开口说话唱歌,早晚用得上,建议收藏!(附保姆级教程)

除了上面介绍的这 6 种,现在很多 AI 工具都集成了 AI 对口型功能。

但国内的 AI 对口型工具,大家用得最多的,应该就属即梦AI了。

比如像下面这些之前网上爆火的对口型视频,基本都是用即梦AI做的。

林黛玉怼人视频:

动物唱歌:

萌娃唱歌视频:

前阵子春节期间,萌娃对口型唱歌的视频,也是狠狠地赚了一波流量。

比如一些萌娃拜年类的、祝福类的,这类视频,每年都会火一次!

视频上传不方便,感兴趣可以看原文

还有很多场景。再比如,用即梦AI的对口型功能,制作虚拟数字人口播视频, 非常适合不愿意露脸的知识博主。

如果对即梦AI的对口型视频感兴趣,可以看之前写的两篇实操教程:

即梦AI对口型「电脑版」实操教程:

免费!又一款AI对口型神器,让照片开口说话唱歌,1分钟教会,吊打阿里EMO?(附保姆级教程)

即梦AI对口型「手机版」实操教程:

免费,手机可用!又一款AI对口型神器,只需1分钟,让照片开口说话唱歌!(手机版详细教程)

即梦AI的对口型功能之所以这么受大家欢迎,我觉得主要有下面这些优势:

  • 时长较长:标准模式下,最长可生成 36 秒的对口型视频。在免费的对口型工具里,算是比较长的。
  • 电脑、手机都可以使用
  • 角色支持比较全:真人、卡通、动物角色都支持
  • 免费可用:每天都有 66 ~ 100 的免费积分额度
  • 适用场景广泛:演讲、对白、唱歌、表演等

最近看到即梦AI的对口型功能又升级了:

可以生成超逼真的「全身动作」和「背景动效」。

一起来看看效果~

即梦AI对口型「大师模式」

进入即梦AI后,选「数字人」-「对口型」:

操作和之前一样:

上传角色 + 选择「生成效果」+ 一段音频,点「生成视频」,就可以等待生成了。

生成效果之前只有「标准」和「生动」,现在多了「大师」模式。

这 3 种模式的「特点」和「适用场景」:

① 标准模式

仅修改口型,比较适合演讲、对白。

② 生动模式

更丰富的面部动作,比较适合唱歌、表演。但是可能会被裁剪。

就是说,在生动模式下,无论上传什么比例的图片,视频都会被裁剪成 1:1 的大头视频。像下面这样。

左图是上传的图片,右图是使用「生动」模式生成的对口型视频,被裁剪了:

③ 大师模式

可以生成超逼真的「全身动作」和「背景动效」,不被裁剪,且支持多人对口型。

去年测过即梦AI的对口型功能,还是不支持多人的,只能让个别人开口。

而即梦AI新出的「大师」模式,已经可以支持多人对口型了。

但是大师模式的缺点是,暂时还不支持生成动物角色的对口型视频。(标准和生动模式是支持动物角色的)

下面是使用即梦AI的「大师」模式生成的对口型效果。

没被裁剪、支持多人、支持全身动作,效果还是不错的:

总结

即梦AI最新升级的「大师」模式,是基于字节跳动研发的 OmniHuman

不仅面部效果比较好,相比于之前,还支持了「全身动作」和「背景动效」。

OmniHuman 它的创新点在于「全条件」的训练策略。

也就是说,OmniHuman 会基于音频片段、文本提示和姿态参考等多种输入信号同时进行训练,才达到了现在这样逼真的对口型效果。

最后来总结一下吧:

目前即梦AI对口型的「大师」模式,已经在网页端和手机 APP 端上线了,感兴趣的可以试试~


更多 AI 工具,见【AI工具】专栏。

相关推荐
OopsOutOfMemory7 小时前
LangChain源码分析(十三)- 运行时与监控
ai·langchain·aigc·ai编程·ai应用
OopsOutOfMemory8 小时前
LangChain源码分析(一)- LLM大语言模型
人工智能·语言模型·langchain·aigc
大美B端工场-B端系统美颜师1 天前
从“如何画”到“为何画”:AIGC倒逼UI设计师回归设计本源
ui·回归·aigc
落羽的落羽2 天前
【Linux系统】快速入门一些常用的基础指令
linux·服务器·人工智能·学习·机器学习·aigc
小溪彼岸2 天前
使用Claude Code Router轻松切换各种高性价比模型
aigc·claude
程序猿二饭2 天前
万字详解:混元大模型+GraphRAG+知识图谱实现永久记忆的专属AI伴侣
aigc
FogLetter2 天前
PromptTemplate:让AI对话像“填空”一样简单高效!
aigc·openai·ai编程
小溪彼岸2 天前
Claude Code CLI平台与中转站接入汇总及避坑
aigc·claude
春末的南方城市2 天前
复旦&华为提出首个空间理解和生成统一框架UniUGG,支持参考图像和任意视图变换的 3D 场景生成和空间视觉问答 (VQA) 任务。
人工智能·科技·深度学习·计算机视觉·aigc
小溪彼岸2 天前
不习惯终端黑窗口?Claude Code Chat可视化插件猜你会喜欢
aigc·claude