人工智能之基于阿里云快速搭建语音合成

人工智能之基于阿里云快速搭建语音合成

需求描述

  1. 基于阿里云搭建语音合成模型,模型名称:iic/speech_sambert-hifigan_tts_zh-cn_16k
  2. 使用上述模型输入一段文字合成语音,模型路径

业务实现

阿里云配置

阿里云配置如下:

代码验证

python 复制代码
from modelscope.outputs import OutputKeys
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks

text = '你好!我是一个人工智能助手,专门帮助用户回答问题、提供信息和解决问题。我可以回答各种主题,包括科学、技术、文学、历史等。\
        如果你有任何问题或者需要帮助的地方,请随时告诉我!'
model_id = 'damo/speech_sambert-hifigan_tts_zh-cn_16k'
sambert_hifigan_tts = pipeline(task=Tasks.text_to_speech, model=model_id)
output = sambert_hifigan_tts(input=text, voice='zhitian_emo')
wav = output[OutputKeys.OUTPUT_WAV]
with open('output.wav', 'wb') as f:
    f.write(wav)

结果展示如下,能够生成语音并且能够进行播放:

从多次搭建的经验来看,建议在搭建模型相关的内容的时候,优先选择阿里云的相关服务,很多东西阿里云的容器云已经提供底层技术,可以很快的使用modelscope提供的操作内容进行快速的模型搭建。

相关推荐
MediaTea5 分钟前
AI 术语通俗词典:logits
人工智能
摄影图6 分钟前
神经网络创意科技图片素材 满足多场景科技设计创作需求
人工智能·科技·神经网络·aigc·插画
Leweslyh11 分钟前
【论文翻译】意图驱动的多智能体大语言模型网络管理:Confucius框架
人工智能·语言模型·自然语言处理
闵孚龙11 分钟前
AI Agent多智能体编排爆款解析:Claude Code Subagent、Fork、Coordinator、Bridge远程执行与安全治理全拆解
大数据·人工智能·安全
HIT_Weston13 分钟前
86、【Agent】【OpenCode】bash 工具提示词(完结)
人工智能·agent·opencode
Maiko Star20 分钟前
* SpringAI多模型共存指南(如何配置多模型)
人工智能·springai
号码认证服务20 分钟前
客户看到来电显示公司名会更愿意接听吗?企业号码认证提升ROI
服务器·网络·c++·经验分享·智能手机·云计算·php
zhangxingchao24 分钟前
AI应用开发一: AI 编程、大模型调用和 Agent
前端·人工智能·后端
SomeOtherTime27 分钟前
电场相关(AI回答)
人工智能
城事漫游Molly30 分钟前
统计研究路线图:PPDAC问题解决循环
大数据·人工智能·论文笔记·科研统计