python调用GPT-4o实时音频 Azure OpenAI GPT-4o Audio and /realtime

发现这块网上信息很少,记录一下

微软azure入口

https://learn.microsoft.com/zh-cn/azure/ai-services/openai/realtime-audio-quickstart?pivots=programming-language-ai-studio

sdk文档

https://github.com/azure-samples/aoai-realtime-audio-sdk?tab=readme-ov-file#summary-of-commands

  1. 创建虚拟环境,自己用conda创建也行

  2. 安装依赖项,这一步如果下载 .whl 文件有问题,自己从仓库releases手动下载一下:
    https://github.com/Azure-Samples/aoai-realtime-audio-sdk/releases

  3. 设置虚拟环境:

    第三步,设置虚拟环境也可以在代码里,通过os库设置

python 复制代码
os.environ["AZURE_OPENAI_API_KEY"] = "xxxx"
os.environ["AZURE_OPENAI_ENDPOINT"] = "https://nlp-gpt4o-realtime-eastus2.openai.azure.com"
os.environ["AZURE_OPENAI_DEPLOYMENT"] = "gpt-4o-realtime-preview"
os.environ["AZURE_OPENAI_API_VERSION"] = "2024-10-01-preview"

后续的就直接跑 xxx_sample.py 测试用例就可以了。

python low_level_sample.py ./input/arc-easy-q237-tts.wav

相关推荐
清水白石00826 分钟前
从打印对象到高质量调试:彻底理解 Python 中 `__repr__` 和 `__str__` 的区别
开发语言·python
Sammyyyyy38 分钟前
Google I/O 2026 Antigravity 更新解析与 SDK 实战指南
python·ai编程·servbay
嫂子的姐夫1 小时前
047-MD5:飞卢网
爬虫·python·js逆向·逆向
DXM05211 小时前
第8期| 传统机器学习遥感解译:SVM & 随机森林分类全流程实操
人工智能·python·随机森林·机器学习·支持向量机·arcgis·自然语言处理
装不满的克莱因瓶1 小时前
深入PyTorch模型的训练与可视化 —— 掌握迁移学习等模型训练效果提升的办法
人工智能·pytorch·python·深度学习·神经网络·ai·迁移学习
localbob1 小时前
日语视频 SRT 字幕生成软件下载:日语视频本地自动翻译SRT字幕生成、日语视频自动翻译 Faster Whisper v1.7 下载与使用教程(含AMD显卡支持)
whisper·音视频·机器翻译·日语字幕翻译·日语视频翻译·本地ai翻译日语视频
无心水1 小时前
【OpenClaw:赚钱】案例19、内容产量5倍、广告收入翻4倍:播客转多平台内容矩阵全自动化实战(OpenAI Whisper + Claude)
java·人工智能·python·ai编程·openclaw·养龙虾·java.time
逗逗班学Python1 小时前
基于 Faster-Whisper 的本地语音转字幕与会议纪要系统:从音频转写到 SRT 字幕与 Markdown 纪要完整项目实战
python·语音识别·faster-whisper·字幕生成·会议纪要
The moon forgets1 小时前
ABot-M0:基于动作流形学习的机器人操作VLA基础模型深度解析
人工智能·pytorch·python·学习·具身智能·vla·点云分割
Cloud_Shy6182 小时前
解读《Effective Python 3rd Edition》:从练气到老魔(第四章 Item 27 - 29)
开发语言·人工智能·经验分享·python·学习方法