人工智能之基于阿里云快速搭建语音合成

人工智能之基于阿里云快速搭建语音合成

需求描述

  1. 基于阿里云搭建语音合成模型,模型名称:iic/speech_sambert-hifigan_tts_zh-cn_16k
  2. 使用上述模型输入一段文字合成语音,模型路径

业务实现

阿里云配置

阿里云配置如下:

代码验证

python 复制代码
from modelscope.outputs import OutputKeys
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks

text = '你好!我是一个人工智能助手,专门帮助用户回答问题、提供信息和解决问题。我可以回答各种主题,包括科学、技术、文学、历史等。\
        如果你有任何问题或者需要帮助的地方,请随时告诉我!'
model_id = 'damo/speech_sambert-hifigan_tts_zh-cn_16k'
sambert_hifigan_tts = pipeline(task=Tasks.text_to_speech, model=model_id)
output = sambert_hifigan_tts(input=text, voice='zhitian_emo')
wav = output[OutputKeys.OUTPUT_WAV]
with open('output.wav', 'wb') as f:
    f.write(wav)

结果展示如下,能够生成语音并且能够进行播放:

从多次搭建的经验来看,建议在搭建模型相关的内容的时候,优先选择阿里云的相关服务,很多东西阿里云的容器云已经提供底层技术,可以很快的使用modelscope提供的操作内容进行快速的模型搭建。

相关推荐
TDengine (老段)6 分钟前
优化 TDengine IDMP 面板编辑的几种方法
人工智能·物联网·ai·时序数据库·tdengine·涛思数据
数据的世界0143 分钟前
Visual Studio 2026 正式发布:AI 原生 IDE 与性能革命的双向突破
ide·人工智能·visual studio
shayudiandian2 小时前
深度学习中的激活函数全解析:该选哪一个?
人工智能·深度学习
视界先声2 小时前
如何选择合适的养老服务机器人
人工智能·物联网·机器人
RPA机器人就选八爪鱼2 小时前
RPA财务机器人:重塑财务效率,数字化转型的核心利器
大数据·数据库·人工智能·机器人·rpa
腾讯WeTest3 小时前
Al in CrashSight ——基于AI优化异常堆栈分类模型
人工智能·分类·数据挖掘
凯子坚持 c3 小时前
openGauss向量数据库技术演进与AI应用生态全景
数据库·人工智能
嵌入式-老费3 小时前
自己动手写深度学习框架(从网络训练到部署)
人工智能·深度学习
温柔哥`4 小时前
HiProbe-VAD:通过在免微调多模态大语言模型中探测隐状态实现视频异常检测
人工智能·语言模型·音视频