虚幻引擎 | 实时语音转口型 Multilingual lipsync

实时语音转口型:EPIC的metahuman sdk,NVIDIA的audio2face,都好。本文使用metahuman sdk

需要工具:Metahuman SDK网页账号,获取两日免费tokens

https://space.metahumansdk.io/#/unauthorized

------------------------------------------------------------正文开始------------------------------------------------

runtime文字转语音 节点!!!

https://docs.metahumansdk.io/metahuman-sdk/reference/metahumansdk-unreal-engine-plugin/text-to-speech

Runtime语音转Lipsync 节点!!!

语音效果

(1)google 谷歌引擎

⑥cmn-CN-Wavenet-C:男机器声(感觉这个最好)

(2)azure 引擎(效果比谷歌的更好)

普通话:

②zh-CN-XiaohanNeural 女声(声音比①好听)

③zh-CN-XiaohuangNeural 萝莉音

④zh-CN-XiaoxiaoNeural:好听的小姐姐的声音


版权声明:语音效果部分为博主码农烧烤趴原创文章,原文链接👇

UE5中插件MetaHumanSDK的使用_metahuman sdk-CSDN博客

总结!!!:

文字实时聊天:chatgpt / 文心一言千帆 (openAI API)VArest

文字转语音:讯飞 / elevenlabs /metahuman sdk

语音转lipsync:metahuman sdk / audio2 face

相关推荐
DisonTangor18 小时前
【小米拥抱开源】小米MiMo团队开源309B专家混合模型——MiMo-V2-Flash
人工智能·开源·aigc
hxxjxw19 小时前
Pytorch分布式训练/多卡训练(六) —— Expert Parallelism (MoE的特殊策略)
人工智能·pytorch·python
Robot侠19 小时前
视觉语言导航从入门到精通(一)
网络·人工智能·microsoft·llm·vln
掘金一周19 小时前
【用户行为监控】别只做工具人了!手把手带你写一个前端埋点统计 SDK | 掘金一周 12.18
前端·人工智能·后端
神州问学19 小时前
世界模型:AI的下一个里程碑
人工智能
zhaodiandiandian19 小时前
AI深耕产业腹地 新质生产力的实践路径与价值彰显
人工智能
古德new19 小时前
openFuyao AI大数据场景加速技术实践指南
大数据·人工智能
youcans_19 小时前
【医学影像 AI】FunBench:评估多模态大语言模型的眼底影像解读能力
论文阅读·人工智能·大语言模型·多模态·眼底图像
dagouaofei19 小时前
PPT AI生成实测报告:哪些工具值得长期使用?
人工智能·python·powerpoint
蓝桉~MLGT19 小时前
Ai-Agent学习历程—— Agent认知框架
人工智能·学习