人工智能之基于阿里云快速搭建语音合成

人工智能之基于阿里云快速搭建语音合成

需求描述

  1. 基于阿里云搭建语音合成模型,模型名称:iic/speech_sambert-hifigan_tts_zh-cn_16k
  2. 使用上述模型输入一段文字合成语音,模型路径

业务实现

阿里云配置

阿里云配置如下:

代码验证

python 复制代码
from modelscope.outputs import OutputKeys
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks

text = '你好!我是一个人工智能助手,专门帮助用户回答问题、提供信息和解决问题。我可以回答各种主题,包括科学、技术、文学、历史等。\
        如果你有任何问题或者需要帮助的地方,请随时告诉我!'
model_id = 'damo/speech_sambert-hifigan_tts_zh-cn_16k'
sambert_hifigan_tts = pipeline(task=Tasks.text_to_speech, model=model_id)
output = sambert_hifigan_tts(input=text, voice='zhitian_emo')
wav = output[OutputKeys.OUTPUT_WAV]
with open('output.wav', 'wb') as f:
    f.write(wav)

结果展示如下,能够生成语音并且能够进行播放:

从多次搭建的经验来看,建议在搭建模型相关的内容的时候,优先选择阿里云的相关服务,很多东西阿里云的容器云已经提供底层技术,可以很快的使用modelscope提供的操作内容进行快速的模型搭建。

相关推荐
xier_ran5 分钟前
深度学习:Adam 优化器实战(Adam Optimizer)
人工智能·深度学习
人工智能训练6 分钟前
Ubuntu中如何进入root用户
linux·运维·服务器·人工智能·ubuntu·ai编程·root
Cathy Bryant13 分钟前
信息论(五):联合熵与条件熵
人工智能·笔记·机器学习·数学建模·概率论
Geo_V16 分钟前
LangChain Memory 使用示例
人工智能·python·chatgpt·langchain·openai·大模型应用·llm 开发
weixin_3077791336 分钟前
软件演示环境动态扩展与成本优化:基于目标跟踪与计划扩展的AWS Auto Scaling策略
算法·云原生·云计算·aws
Carl_奕然37 分钟前
【机器视觉】一文掌握常见图像增强算法。
人工智能·opencv·算法·计算机视觉
放羊郎38 分钟前
人工智能算法优化YOLO的目标检测能力
人工智能·算法·yolo·视觉slam·建图
xuehaikj44 分钟前
基于YOLOv5-AUX的棕熊目标检测与识别系统实现
人工智能·yolo·目标检测
xier_ran2 小时前
深度学习:从零开始手搓一个深层神经网络
人工智能·深度学习·神经网络
却道天凉_好个秋2 小时前
OpenCV(二十六):高斯滤波
人工智能·opencv·计算机视觉