人工智能之基于阿里云快速搭建语音合成

人工智能之基于阿里云快速搭建语音合成

需求描述

  1. 基于阿里云搭建语音合成模型,模型名称:iic/speech_sambert-hifigan_tts_zh-cn_16k
  2. 使用上述模型输入一段文字合成语音,模型路径

业务实现

阿里云配置

阿里云配置如下:

代码验证

python 复制代码
from modelscope.outputs import OutputKeys
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks

text = '你好!我是一个人工智能助手,专门帮助用户回答问题、提供信息和解决问题。我可以回答各种主题,包括科学、技术、文学、历史等。\
        如果你有任何问题或者需要帮助的地方,请随时告诉我!'
model_id = 'damo/speech_sambert-hifigan_tts_zh-cn_16k'
sambert_hifigan_tts = pipeline(task=Tasks.text_to_speech, model=model_id)
output = sambert_hifigan_tts(input=text, voice='zhitian_emo')
wav = output[OutputKeys.OUTPUT_WAV]
with open('output.wav', 'wb') as f:
    f.write(wav)

结果展示如下,能够生成语音并且能够进行播放:

从多次搭建的经验来看,建议在搭建模型相关的内容的时候,优先选择阿里云的相关服务,很多东西阿里云的容器云已经提供底层技术,可以很快的使用modelscope提供的操作内容进行快速的模型搭建。

相关推荐
oioihoii5 分钟前
AI随身翻译设备:从翻译工具到智能生活伴侣
人工智能·生活
努力当一个优秀的程序员8 分钟前
0.机器学习基础
人工智能·机器学习
bjxiaxueliang1 小时前
一文详解OpenCV环境搭建:Ubuntu20.4使用CLion配置OpenCV开发环境
人工智能·opencv·计算机视觉
Allen_LVyingbo1 小时前
思维链编程模式下可视化医疗编程具体模块和流程架构分析(全架构与代码版)
大数据·人工智能·重构·架构·健康医疗
有一只柴犬1 小时前
5. 深度剖析:Spring AI项目架构与分层体系全解读
人工智能·spring·架构
乌旭2 小时前
英伟达Blackwell架构深度拆解:新一代GPU如何突破算力瓶颈?
数据结构·人工智能·深度学习·机器学习·ai·架构·ai编程
说私域2 小时前
定制开发开源AI智能名片S2B2C商城小程序源码中的产品运营协同进化机制研究
人工智能·小程序·开源·产品运营·零售
断眉的派大星2 小时前
用opencv校正图片的方向
人工智能·opencv·计算机视觉
西柚小萌新2 小时前
【深度学习:理论篇】--Pytorch基础入门
人工智能·pytorch·深度学习
Jamence3 小时前
多模态大语言模型arxiv论文略读(七)
人工智能·深度学习·语言模型