技术栈

tta

minhuan
2 天前
大模型应用·musicgen模型应用·tta·文本生成音频
大模型应用:TTA文本驱动音频:MusicGen大模型参数调优+音频情绪可视化.23随着语音大模型的普及,不管是TTS还是ASR,都与音频处理有着紧密的联系,AIGC的蓬勃发展,也催生了文本到音频(Text-to-Audio, TTA)的落地场景,音乐生成也走进了我们的实际应用。基于传统的信号合成技术凭借完全可控、轻量化的优势,在场景化音效补充中不可替代;而声乐大模型也是雨后勃发,以 MusicGen 为代表的 TTA 大模型,则通过海量数据训练实现了文本意图驱动的创意生成。
我是有底线的