技术栈
多语言语音生成
Soari
2 小时前
开源
·
github
·
语音合成
·
tts
·
多语言语音生成
GitHub 开源项目解析:OpenBMB/VoxCPM —— Tokenizer-Free 多语言语音合成与声音克隆模型
近年来,大语言模型与多模态模型快速发展,语音生成也从传统的拼接式、声学模型式 TTS,逐渐走向大模型驱动的高表现力语音合成。相比普通文本转语音系统,现代 TTS 不仅要求“能读出来”,还要求具备自然韵律、情绪表达、多语言支持、声音克隆、风格控制和实时流式输出能力。
我是有底线的