微软Azure文本转音频,保存成MP3文件【代码python3】


标签: 文本转音频并保存mp3文件; 微软Azure;


微软Azure可以将文本转音频,并保存mp3文件,直接上代码

代码格式:python 3

python 复制代码
import os
import azure.cognitiveservices.speech as speechsdk

# This example requires environment variables named "SPEECH_KEY" and "SPEECH_REGION"
speech_config = speechsdk.SpeechConfig(subscription=os.environ.get('SPEECH_KEY'), region=os.environ.get('SPEECH_REGION'))

# The language of the voice that speaks.
speech_config.speech_synthesis_voice_name='zh-CN-YunjianNeural'   # 这个男声 有 磁性
text = "讲一个笑话:和朋友去饭店吃饭,要了一盘红烧肉,结果发现怎么咬都咬不动,我顿时就火了,把服务员叫过来喊道:你们这肉怎么咬都咬不动,把你们经理叫来。服务员说:叫我们经理干啥啊,你都咬不动,他能咬得动啊!"
speech_config.set_speech_synthesis_output_format(speechsdk.SpeechSynthesisOutputFormat.Audio24Khz160KBitRateMonoMp3) # 这里配置文件为mp3格式,要保存其它文件格式,修改这里参数
speech_synthesizer = speechsdk.SpeechSynthesizer(speech_config=speech_config, audio_config=None)

result = speech_synthesizer.speak_text_async(text).get()
stream = speechsdk.AudioDataStream(result)
stream.save_to_wav_file("D:/file.mp3")  # mp3文件保存路径


if result.reason == speechsdk.ResultReason.SynthesizingAudioCompleted:
    print("Speech synthesized Completed,  for text [{}]".format(text))
elif result.reason == speechsdk.ResultReason.Canceled:
    cancellation_details = result.cancellation_details
    print("Speech synthesis canceled: {}".format(cancellation_details.reason))
    if cancellation_details.reason == speechsdk.CancellationReason.Error:
        if cancellation_details.error_details:
            print("Error details: {}".format(cancellation_details.error_details))
            print("Did you set the speech resource key and region values?")

注意:

1,代码运行前,SPEECH_KEY和SPEECH_REGION已生成好,并保存在你的环境变量中。 参考:https://learn.microsoft.com/zh-cn/azure/ai-services/speech-service/get-started-text-to-speech?tabs=windows%2Cterminal&pivots=programming-language-javascript#prerequisites

2,python 要求3.7以上。

参考:

微软Azure Python 示例代码
https://learn.microsoft.com/zh-cn/azure/ai-services/speech-service/get-started-text-to-speech?tabs=windows%2Cterminal&pivots=programming-language-python#prerequisites

支持不同的语音和声音形式(男声、女声)
https://learn.microsoft.com/zh-cn/azure/ai-services/speech-service/language-support?tabs=tts


作者简介:https://shimo.im/docs/rp3OVwxle2fJn7Am/

上海徐汇

2023年10月29日


相关推荐
red1giant_star3 分钟前
Python根据文件后缀统计文件大小、找出文件位置(仿Everything)
后端·python
ZhiqianXia6 分钟前
《The Design of Design》阅读笔记
前端·笔记·microsoft
雷欧力15 分钟前
如何使用 Claude API?3 种接入方案实测,附完整代码(2026)
python·claude
神仙别闹19 分钟前
基于 Python 实现 BERT 的情感分析模型
开发语言·python·bert
NQBJT26 分钟前
VS Code配置Python人工智能开发环境
开发语言·人工智能·vscode·python
浮游本尊28 分钟前
一文讲透巡检链路:采集程序 → 上传数据包 → 后端解析入库 → 分析出报告
python
a1117761 小时前
MonoGS 在 Jetson Orin Nano 上的部署与性能测试
python·开源·torch·cv
偶尔微微一笑1 小时前
智能体四大核心模块揭秘
python
2301_815901971 小时前
SQL如何将多行记录聚合成逗号分隔字符串_GROUP_CONCAT技巧
jvm·数据库·python
西索斯1 小时前
Claude API 报 529 Overloaded 怎么办?3 种方案实测,最后一种最省心
python·claude