人工智能之基于阿里云快速搭建语音合成

人工智能之基于阿里云快速搭建语音合成

需求描述

  1. 基于阿里云搭建语音合成模型,模型名称:iic/speech_sambert-hifigan_tts_zh-cn_16k
  2. 使用上述模型输入一段文字合成语音,模型路径

业务实现

阿里云配置

阿里云配置如下:

代码验证

python 复制代码
from modelscope.outputs import OutputKeys
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks

text = '你好!我是一个人工智能助手,专门帮助用户回答问题、提供信息和解决问题。我可以回答各种主题,包括科学、技术、文学、历史等。\
        如果你有任何问题或者需要帮助的地方,请随时告诉我!'
model_id = 'damo/speech_sambert-hifigan_tts_zh-cn_16k'
sambert_hifigan_tts = pipeline(task=Tasks.text_to_speech, model=model_id)
output = sambert_hifigan_tts(input=text, voice='zhitian_emo')
wav = output[OutputKeys.OUTPUT_WAV]
with open('output.wav', 'wb') as f:
    f.write(wav)

结果展示如下,能够生成语音并且能够进行播放:

从多次搭建的经验来看,建议在搭建模型相关的内容的时候,优先选择阿里云的相关服务,很多东西阿里云的容器云已经提供底层技术,可以很快的使用modelscope提供的操作内容进行快速的模型搭建。

相关推荐
cnbestec27 分钟前
GelSight Mini视触觉传感器凝胶触头升级:增加40%耐用性,拓展机器人与触觉AI 应用边界
人工智能·机器人
bohu8334 分钟前
ros2-4.2 用python实现人脸识别
人工智能·opencv·人脸识别·ros2·服务调用
Loving_enjoy1 小时前
ChatGPT 数据分析与处理使用详解
大数据·人工智能
whaosoft-1431 小时前
51c自动驾驶~合集45
人工智能
刘大猫262 小时前
《docker基础篇:1.Docker简介》,包括Docker是什么、容器与虚拟机比较、能干嘛、去哪下
人工智能·操作系统·团队管理
hfmeet2 小时前
行为分析:LSTM、3D CNN、SlowFast Networks。这三者的优缺点
人工智能·cnn·lstm
小灰灰__2 小时前
LLM大模型实践10-聊天机器人
人工智能·chatgpt·机器人
MicrosoftReactor2 小时前
技术速递|通过 .NET Aspire 使用本地 AI 模型
人工智能·.net·.net aspire
Lunar*2 小时前
视频抽帧工具:按需提取高质量数据集
人工智能·数据分析
爱研究的小牛3 小时前
Synthesia技术浅析(二):虚拟人物视频生成
人工智能·深度学习·机器学习·aigc·音视频