人工智能之基于阿里云快速搭建语音合成

奔波儿灞爱霸波尔奔2025-01-09 12:45

人工智能之基于阿里云快速搭建语音合成

需求描述

基于阿里云搭建语音合成模型，模型名称：iic/speech_sambert-hifigan_tts_zh-cn_16k
使用上述模型输入一段文字合成语音，模型路径

业务实现

阿里云配置

阿里云配置如下：

代码验证

python 复制代码

from modelscope.outputs import OutputKeys
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks

text = '你好！我是一个人工智能助手，专门帮助用户回答问题、提供信息和解决问题。我可以回答各种主题，包括科学、技术、文学、历史等。\
        如果你有任何问题或者需要帮助的地方，请随时告诉我！'
model_id = 'damo/speech_sambert-hifigan_tts_zh-cn_16k'
sambert_hifigan_tts = pipeline(task=Tasks.text_to_speech, model=model_id)
output = sambert_hifigan_tts(input=text, voice='zhitian_emo')
wav = output[OutputKeys.OUTPUT_WAV]
with open('output.wav', 'wb') as f:
    f.write(wav)

结果展示如下，能够生成语音并且能够进行播放：

从多次搭建的经验来看，建议在搭建模型相关的内容的时候，优先选择阿里云的相关服务，很多东西阿里云的容器云已经提供底层技术，可以很快的使用modelscope提供的操作内容进行快速的模型搭建。