python调用GPT-4o实时音频 Azure OpenAI GPT-4o Audio and /realtime

发现这块网上信息很少,记录一下

微软azure入口

https://learn.microsoft.com/zh-cn/azure/ai-services/openai/realtime-audio-quickstart?pivots=programming-language-ai-studio

sdk文档

https://github.com/azure-samples/aoai-realtime-audio-sdk?tab=readme-ov-file#summary-of-commands

  1. 创建虚拟环境,自己用conda创建也行

  2. 安装依赖项,这一步如果下载 .whl 文件有问题,自己从仓库releases手动下载一下:
    https://github.com/Azure-Samples/aoai-realtime-audio-sdk/releases

  3. 设置虚拟环境:

    第三步,设置虚拟环境也可以在代码里,通过os库设置

python 复制代码
os.environ["AZURE_OPENAI_API_KEY"] = "xxxx"
os.environ["AZURE_OPENAI_ENDPOINT"] = "https://nlp-gpt4o-realtime-eastus2.openai.azure.com"
os.environ["AZURE_OPENAI_DEPLOYMENT"] = "gpt-4o-realtime-preview"
os.environ["AZURE_OPENAI_API_VERSION"] = "2024-10-01-preview"

后续的就直接跑 xxx_sample.py 测试用例就可以了。

python low_level_sample.py ./input/arc-easy-q237-tts.wav

相关推荐
海哥编程43 分钟前
Python 数据分析(二):Matplotlib 绘图
python·数据分析·matplotlib
go54631584652 小时前
Python点阵字生成与优化:从基础实现到高级渲染技术
开发语言·人工智能·python·深度学习·分类·数据挖掘
猫头虎2 小时前
2025年02月11日 Go生态洞察:Go 1.24 发布亮点全面剖析
开发语言·后端·python·golang·go·beego·go1.19
仰望天空—永强2 小时前
PS 2025【七月最新v26.5】PS铺软件安装|最新版|附带安装文件|详细安装说明|附PS插件
开发语言·图像处理·python·图形渲染·photoshop
肥or胖2 小时前
【音视频协议篇】WebRTC 快速入门
ffmpeg·音视频·webrtc
MediaTea2 小时前
Python 库手册:xmlrpc.client 与 xmlrpc.server 模块
开发语言·python
悦悦子a啊2 小时前
Python之--字典
开发语言·python·学习
水军总督2 小时前
OpenCV+Python
python·opencv·计算机视觉
qyhua3 小时前
Windows 平台源码部署 Dify教程(不依赖 Docker)
人工智能·windows·python
aqi003 小时前
FFmpeg开发笔记(七十八)采用Kotlin+Compose的NextPlayer播放器
android·ffmpeg·音视频·直播·流媒体