虚幻引擎 | 实时语音转口型 Multilingual lipsync

实时语音转口型:EPIC的metahuman sdk,NVIDIA的audio2face,都好。本文使用metahuman sdk

需要工具:Metahuman SDK网页账号,获取两日免费tokens

https://space.metahumansdk.io/#/unauthorized

------------------------------------------------------------正文开始------------------------------------------------

runtime文字转语音 节点!!!

https://docs.metahumansdk.io/metahuman-sdk/reference/metahumansdk-unreal-engine-plugin/text-to-speech

Runtime语音转Lipsync 节点!!!

语音效果

(1)google 谷歌引擎

⑥cmn-CN-Wavenet-C:男机器声(感觉这个最好)

(2)azure 引擎(效果比谷歌的更好)

普通话:

②zh-CN-XiaohanNeural 女声(声音比①好听)

③zh-CN-XiaohuangNeural 萝莉音

④zh-CN-XiaoxiaoNeural:好听的小姐姐的声音


版权声明:语音效果部分为博主码农烧烤趴原创文章,原文链接👇

UE5中插件MetaHumanSDK的使用_metahuman sdk-CSDN博客

总结!!!:

文字实时聊天:chatgpt / 文心一言千帆 (openAI API)VArest

文字转语音:讯飞 / elevenlabs /metahuman sdk

语音转lipsync:metahuman sdk / audio2 face

相关推荐
balmtv1 天前
GPT-5.4镜像实测:gpt技术拆解——当AI学会操控电脑
人工智能·gpt·电脑
大傻^1 天前
Spring AI 2.0 生产部署指南:从 1.x 迁移、性能调优与云原生实践
人工智能·spring·云原生·springai
不懒不懒1 天前
【机器学习模型评估:8种算法对比实战(本篇文章先介绍6种)】
人工智能·机器学习
ejjdhdjdjdjdjjsl1 天前
halcon算子
人工智能·算法·计算机视觉
JEECG低代码平台1 天前
JeecgBoot低代码 AI工作流变量聚合节点:多路数据择优合并与智能兜底方案
人工智能·低代码
2501_933329551 天前
万字拆解Infoseek舆情监测系统:基于大模型+多模态的分布式舆情中台架构实践
人工智能·分布式·架构·媒体
大傻^1 天前
SpringAI2.0 RAG 完整实现:Document ETL、Vector Store 与检索增强
人工智能·检索增强·rag·springai
人工智能AI技术1 天前
C# Runner + OpenClaw双实战:用.NET写原生AI Agent,告别Python依赖
人工智能·c#
8Qi81 天前
Hello-Agents学习笔记--旅行助手智能体案例
人工智能·llm·agent·智能体·tavily