虚幻引擎 | 实时语音转口型 Multilingual lipsync

实时语音转口型:EPIC的metahuman sdk,NVIDIA的audio2face,都好。本文使用metahuman sdk

需要工具:Metahuman SDK网页账号,获取两日免费tokens

https://space.metahumansdk.io/#/unauthorized

------------------------------------------------------------正文开始------------------------------------------------

runtime文字转语音 节点!!!

https://docs.metahumansdk.io/metahuman-sdk/reference/metahumansdk-unreal-engine-plugin/text-to-speech

Runtime语音转Lipsync 节点!!!

语音效果

(1)google 谷歌引擎

⑥cmn-CN-Wavenet-C:男机器声(感觉这个最好)

(2)azure 引擎(效果比谷歌的更好)

普通话:

②zh-CN-XiaohanNeural 女声(声音比①好听)

③zh-CN-XiaohuangNeural 萝莉音

④zh-CN-XiaoxiaoNeural:好听的小姐姐的声音


版权声明:语音效果部分为博主码农烧烤趴原创文章,原文链接👇

UE5中插件MetaHumanSDK的使用_metahuman sdk-CSDN博客

总结!!!:

文字实时聊天:chatgpt / 文心一言千帆 (openAI API)VArest

文字转语音:讯飞 / elevenlabs /metahuman sdk

语音转lipsync:metahuman sdk / audio2 face

相关推荐
Promise微笑14 小时前
SF6综合测试仪:国产替代SF6综合测试仪的精密化进阶与自主实践
运维·人工智能·安全
AndrewHZ14 小时前
【大模型技术博客】什么是大语言模型(LLM)?从零认识AI新范式
人工智能·深度学习·ai·语言模型·大模型·llm·transformer
godspeed_lucip14 小时前
LLM和Agent——专题5: LLM Ops 入门(1)
人工智能·python
lqqjuly14 小时前
状态空间模型:从经典控制论到现代序列建模——S4、Mamba 及其理论体系的完整论述(一)
人工智能
逻辑君14 小时前
本地LLM的图像和视频理解
人工智能
AI医影跨模态组学14 小时前
Nat. Biomed. Eng(1区top,IF=26.6)上海科技大学钱学军团队:一种用于乳腺癌风险分层的多模态机器学习模型
人工智能·科技·深度学习·机器学习·论文·医学影像
翼龙云_cloud14 小时前
腾讯云代理商:腾讯云云桌面如何部署Hermes Agent?
人工智能·云计算·腾讯云·ai智能体·hermes agent
菜鸡旭旭14 小时前
【AI培训中台-话术润色】
人工智能
ftpeak14 小时前
深入浅出 LoongSuite Python Agent:让你的 AI 应用「透明化」(下篇)
开发语言·人工智能·ai·ai编程·ai开发
蔡俊锋14 小时前
为Agent重新设计云:Vibe Coding背后的新基建
人工智能·ai编程