技术栈

多语言语音生成

Soari
2 小时前
开源·github·语音合成·tts·多语言语音生成
GitHub 开源项目解析:OpenBMB/VoxCPM —— Tokenizer-Free 多语言语音合成与声音克隆模型近年来,大语言模型与多模态模型快速发展,语音生成也从传统的拼接式、声学模型式 TTS,逐渐走向大模型驱动的高表现力语音合成。相比普通文本转语音系统,现代 TTS 不仅要求“能读出来”,还要求具备自然韵律、情绪表达、多语言支持、声音克隆、风格控制和实时流式输出能力。
我是有底线的