人工智能之基于阿里云快速搭建语音合成

人工智能之基于阿里云快速搭建语音合成

需求描述

  1. 基于阿里云搭建语音合成模型,模型名称:iic/speech_sambert-hifigan_tts_zh-cn_16k
  2. 使用上述模型输入一段文字合成语音,模型路径

业务实现

阿里云配置

阿里云配置如下:

代码验证

python 复制代码
from modelscope.outputs import OutputKeys
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks

text = '你好!我是一个人工智能助手,专门帮助用户回答问题、提供信息和解决问题。我可以回答各种主题,包括科学、技术、文学、历史等。\
        如果你有任何问题或者需要帮助的地方,请随时告诉我!'
model_id = 'damo/speech_sambert-hifigan_tts_zh-cn_16k'
sambert_hifigan_tts = pipeline(task=Tasks.text_to_speech, model=model_id)
output = sambert_hifigan_tts(input=text, voice='zhitian_emo')
wav = output[OutputKeys.OUTPUT_WAV]
with open('output.wav', 'wb') as f:
    f.write(wav)

结果展示如下,能够生成语音并且能够进行播放:

从多次搭建的经验来看,建议在搭建模型相关的内容的时候,优先选择阿里云的相关服务,很多东西阿里云的容器云已经提供底层技术,可以很快的使用modelscope提供的操作内容进行快速的模型搭建。

相关推荐
Coder_Boy_1 天前
基于SpringAI的企业级智能教学考试平台模块三:个性化赋能模块内容
人工智能·spring cloud
一点一木1 天前
🚀 2025 年 12 月 GitHub 十大热门项目排行榜 🔥
前端·人工智能·github
Hcoco_me1 天前
大模型面试题35:Pre-LayerNorm vs Post-LayerNorm对深层Transformer训练稳定性
人工智能·rnn·深度学习·自然语言处理·lstm·transformer·word2vec
人工智能技术咨询.1 天前
深度学习—卷积神经网络(4)
人工智能
gorgeous(๑>؂<๑)1 天前
【南开大学-范登平组-arXiv25】Context-measure:用于伪装目标检测的情境化度量指标
人工智能·目标检测·计算机视觉
北邮刘老师1 天前
【智能体互联协议解析】智能体点对点交互模式的三种实现方式和应用场景
数据库·人工智能·架构·智能体·智能体互联网
努力犯错1 天前
Qwen Image 2512 工作流:2026 年 AI 图像生成完整指南
人工智能
安娜的信息安全说1 天前
AI安全新战场:Prompt安全的未来趋势与挑战
人工智能·安全·prompt
爱学习的张大1 天前
Transformer 可视化详解(第二部分):工作原理分步拆解
人工智能·深度学习·transformer
说私域1 天前
基于开源AI智能名片链动2+1模式商城系统的创始人个人品牌资产构建研究
人工智能·小程序·开源