实战 OpenAI 新一代实时语音:用 gpt-realtime-2 跑一个会推理的语音助手5 月 7 日 OpenAI 在 API 里上线了三款新的实时语音模型:gpt-realtime-2(具备 GPT-5 级推理、上下文从 3.2 万扩到 12.8 万 token)、gpt-realtime-translate(70+ 种输入语言实时翻译到 13 种输出语言)、gpt-realtime-whisper(流式语音转写)。它们都在同一个 Realtime API 下。本文给出一条可跑的最短路径:后端签发 ephemeral token,浏览器用 WebRTC 直连模型,并用 session.u