人工智能之基于阿里云快速搭建语音合成

人工智能之基于阿里云快速搭建语音合成

需求描述

  1. 基于阿里云搭建语音合成模型,模型名称:iic/speech_sambert-hifigan_tts_zh-cn_16k
  2. 使用上述模型输入一段文字合成语音,模型路径

业务实现

阿里云配置

阿里云配置如下:

代码验证

python 复制代码
from modelscope.outputs import OutputKeys
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Tasks

text = '你好!我是一个人工智能助手,专门帮助用户回答问题、提供信息和解决问题。我可以回答各种主题,包括科学、技术、文学、历史等。\
        如果你有任何问题或者需要帮助的地方,请随时告诉我!'
model_id = 'damo/speech_sambert-hifigan_tts_zh-cn_16k'
sambert_hifigan_tts = pipeline(task=Tasks.text_to_speech, model=model_id)
output = sambert_hifigan_tts(input=text, voice='zhitian_emo')
wav = output[OutputKeys.OUTPUT_WAV]
with open('output.wav', 'wb') as f:
    f.write(wav)

结果展示如下,能够生成语音并且能够进行播放:

从多次搭建的经验来看,建议在搭建模型相关的内容的时候,优先选择阿里云的相关服务,很多东西阿里云的容器云已经提供底层技术,可以很快的使用modelscope提供的操作内容进行快速的模型搭建。

相关推荐
软件资深者2 分钟前
【保姆级】OpenClaw 进阶全攻略:高级玩法 + 飞书 + Skills + 安全防护,1 小时变身 “养虾高手”!
人工智能·安全·飞书·数字员工·openclaw·龙虾·高级玩法
安科瑞-小李6 分钟前
公共建筑能耗监测系统的设计方案与节能效益分析
人工智能·数据采集·智慧建筑·公共建筑·能耗可视化
小哈里6 分钟前
【FinOps】云计算基础设施成本管理实践(5原则+4能力域+3阶段)
云原生·云计算·finops·基础设施·成本管理
我材不敲代码8 分钟前
OpenCV 实战:从可乐标志识别到银行卡、身份证号识别(模板匹配 + 轮廓检测)
人工智能·opencv·计算机视觉
图图的点云库9 分钟前
随机采样一致性算法实现
人工智能·算法·机器学习
圣殿骑士-Khtangc9 分钟前
【论文精读】《A Survey of Vibe Coding with Large Language Models》| 通俗解读+核心提炼
人工智能·大模型·vibe coding
ROS机器人学习与交流10 分钟前
gazebo增加二维码模型
人工智能·无人机
鬓戈13 分钟前
大模型Qwen3企业业务数据微调之初体验
人工智能·深度学习·机器学习·语言模型·自然语言处理
jkyy201414 分钟前
以AI智能体为引擎,重塑B端健康服务边界与效率
人工智能·语言模型·自动化·健康医疗
赫尔·普莱蒂科萨·帕塔17 分钟前
针对 AI 的 “信息围猎“
人工智能·agi