python调用GPT-4o实时音频 Azure OpenAI GPT-4o Audio and /realtime

发现这块网上信息很少,记录一下

微软azure入口

https://learn.microsoft.com/zh-cn/azure/ai-services/openai/realtime-audio-quickstart?pivots=programming-language-ai-studio

sdk文档

https://github.com/azure-samples/aoai-realtime-audio-sdk?tab=readme-ov-file#summary-of-commands

  1. 创建虚拟环境,自己用conda创建也行

  2. 安装依赖项,这一步如果下载 .whl 文件有问题,自己从仓库releases手动下载一下:
    https://github.com/Azure-Samples/aoai-realtime-audio-sdk/releases

  3. 设置虚拟环境:

    第三步,设置虚拟环境也可以在代码里,通过os库设置

python 复制代码
os.environ["AZURE_OPENAI_API_KEY"] = "xxxx"
os.environ["AZURE_OPENAI_ENDPOINT"] = "https://nlp-gpt4o-realtime-eastus2.openai.azure.com"
os.environ["AZURE_OPENAI_DEPLOYMENT"] = "gpt-4o-realtime-preview"
os.environ["AZURE_OPENAI_API_VERSION"] = "2024-10-01-preview"

后续的就直接跑 xxx_sample.py 测试用例就可以了。

python low_level_sample.py ./input/arc-easy-q237-tts.wav

相关推荐
aidesignplus几秒前
从平方到线性:Mamba如何挑战Transformer的长序列效率瓶颈?
人工智能·python·深度学习·vim·transformer
2301_773553622 分钟前
Redis怎样优化复制缓冲池大小_调大repl-backlog-size减少频繁的全量同步触发
jvm·数据库·python
三维频道2 分钟前
工业级三维扫描实测:汽车灯具复杂结构件的全尺寸 3D 测量方案分析
java·人工智能·python·数码相机·3d·汽车·汽车轻量化制造
weixin_381288186 分钟前
HTML lang 属性的正确取值规范:BCP 47 格式详解与最佳实践
jvm·数据库·python
阿荻在肝了10 分钟前
Agent学习七:LangGraph学习-持久化与记忆二
python·学习·agent
u01091476012 分钟前
如何正确对 JavaScript 对象的键进行字母序排序
jvm·数据库·python
maqr_11013 分钟前
MySQL在事务中如何实现串行化_使用select lock in share mode查询
jvm·数据库·python
EasyDSS21 分钟前
私有化视频会议平台/视频直播点播/高清点播/音视频点播EasyDSS“直播+点播+会议”全场景融合解锁视频协作新体验
音视频
EasyDSS23 分钟前
企业级融媒体生产管理平台/私有化音视频系统EasyDSS一体化架构打造全流程应急指挥视频会议体系
架构·音视频·媒体
TechWayfarer24 分钟前
离线IP数据库内网部署:场景选型与热更新落地实践
网络·数据库·python·网络协议·tcp/ip