人工智能之基于阿里云快速搭建语音合成

人工智能之基于阿里云快速搭建语音合成

需求描述

  1. 基于阿里云搭建语音合成模型,模型名称:iic/speech_sambert-hifigan_tts_zh-cn_16k
  2. 使用上述模型输入一段文字合成语音,模型路径

业务实现

阿里云配置

阿里云配置如下:

代码验证

python 复制代码
from modelscope.outputs import OutputKeys
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks

text = '你好!我是一个人工智能助手,专门帮助用户回答问题、提供信息和解决问题。我可以回答各种主题,包括科学、技术、文学、历史等。\
        如果你有任何问题或者需要帮助的地方,请随时告诉我!'
model_id = 'damo/speech_sambert-hifigan_tts_zh-cn_16k'
sambert_hifigan_tts = pipeline(task=Tasks.text_to_speech, model=model_id)
output = sambert_hifigan_tts(input=text, voice='zhitian_emo')
wav = output[OutputKeys.OUTPUT_WAV]
with open('output.wav', 'wb') as f:
    f.write(wav)

结果展示如下,能够生成语音并且能够进行播放:

从多次搭建的经验来看,建议在搭建模型相关的内容的时候,优先选择阿里云的相关服务,很多东西阿里云的容器云已经提供底层技术,可以很快的使用modelscope提供的操作内容进行快速的模型搭建。

相关推荐
codelancera6 分钟前
机器学习每日一题001-矩阵转置
人工智能·机器学习·矩阵
Mar1f12 分钟前
阿里云百炼智能体连接云数据库实践(DMS MCP)
数据库·人工智能·mysql·阿里云·oracle
一点一木20 分钟前
🚀 2025 年 08 月 GitHub 十大热门项目排行榜 🔥
前端·人工智能·github
爱分享的飘哥31 分钟前
第一百零二章:AI的“未来电影制片厂CEO”:多模态系统落地项目实战(完整 AI 视频创作平台)
人工智能·微服务·系统架构·llm·tts·多模态ai·ai视频创作平台
IT_陈寒33 分钟前
React性能优化:5个90%开发者不知道的useEffect内存泄漏陷阱与实战解法
前端·人工智能·后端
艾小米1 小时前
AWS申请增加弹性IP配额流程
云计算·aws
可乐+冰08 小时前
Android 编写高斯模糊功能
android·人工智能·opencv
嘀咕博客9 小时前
SynClub-百度在海外推出的AI社交产品
人工智能·百度·ai工具
AI算法工程师Moxi9 小时前
什么是迁移学习(transfer learning)
人工智能·机器学习·迁移学习
空白到白10 小时前
机器学习-KNN算法
人工智能·算法·机器学习