蚂蚁集团支付宝开源了数字人技术EchoMimic,可用于虚拟主播和视频编辑。EchoMimic是一个音频驱动的肖像动画生成工具,具有丰富的表情和流畅的动作。它支持音频驱动、姿势驱动和音频与姿势混合驱动动画,并提供了易于使用的WebUI和GradioUI界面。
效果比SadTalker、MuseTalk好,表情更丰富动作更顺畅。
EchoMimic是一个基于音频驱动的肖像动画生成工具,通过可编辑的特征点条件生成逼真、自然的动画,用户可以根据自己的需求调整动画细节。
功能:
1、音频驱动动画,可以根据音频生成人物肖像的动画,比如唱歌、说话视频等
2、姿势驱动动画,可以根据姿势数据生成人物肖像的动画
3、音频和姿势混合驱动动画,可以同时使用音频和姿势数据来生成动画
4、WebUI 和 GradioUI,提供图形界面,易于使用
项目:https://badtobest.github.io/echomimic.html
模型:https://huggingface.co/BadToBest/EchoMimic
嫌麻烦的小伙伴们,可以直接使用F5 AI社区提供的EchoMimic一键整合包,Windows用户可以本地离线免费生成数字人。
除了给大家准备了EchoMimic一键整合包,F5 AI社区还提供了详细的视频课程和图文教学资料以及1对1指导等服务。即便技术小白,也能确保一分钟熟练上手。
具体操作步骤,请参考【F5 AI社区】文章:
放大招了!EchoMimic照片数字人整合包来袭,音频+面部特征驱动,让你的照片开口说话唱歌,效果逼真惊人!_echomimic 参数-CSDN博客
以下是下载地址
百度网盘下载链接(永久有效):
链接:https://盘.baidu.com/s/1BNPJRUv6Dr23QyQ1EEM3Hw?pwd=z1lt
提取码:z1lt
123网盘下载链接(永久有效):
链接:https://www.123盘.com/s/5DsaTd-QzGc.html
夸克网盘下载链接(永久有效):
链接:https://盘.quark.cn/s/4658ca40014a
关于F5 AI社区
F5 AI社区是一个紧跟全球AI技术和AI产品,秉承"有教程就会有工具"的运营理念,及时为用户整合、提供各类AI工具教程的社区,不管你是0基础学员还是有基础,我们从提供本地离线AI工具整合包开始,让您无限量不限时使用,更有全套在线教程助您无忧学完快速上手,同时我们的AI专家24小时在线,为您解答各种技术疑难问题,助您真正0门槛,0成本,即使是从未接触过的技术小白也能快速无脑掌握前沿的AI技能。