技术栈
文本生成语音
DogDaoDao
3 小时前
深度学习
·
大模型
·
github
·
音频
·
语音模型
·
tss
·
文本生成语音
【GitHub】VoxCPM2 实战全解析:原理、部署与效果对比
简介: VoxCPM2 是 OpenBMB 团队开源的 2B 参数多语言 TTS 模型,支持 30+ 语言、情感控制、声音克隆,音质达到 48kHz。本文从实际使用和源码两个维度拆解它——不堆术语,只讲清楚它是什么、为什么好用、以及怎么把它跑起来。
我是有底线的