GPT-4o目前暂无音频输出的能力

MavenTalk2024-06-26 12:21

OpenAI的发布会惊艳的操作，近乎实时的语音对话，让很多人向往。

但实际上Chat对话时，尚无输出音频的能力，可能还未开放。

这是国外的一个开发小哥的交流帖子，可能还需要些时日才能用的上实时的音频输出。

不过当前OpenAI也开放了两个TTS模型，基于之前的开放的Whisper能力，很有可能Chat输出的音频能力是基于这两个模型完成的。

并且有实时播放能力，相比以前只能全部请求完才能播放也是一个巨大的进步，并且支持中文输出。

上一篇：CAD二次开发（11）-在用C#进行CAD开发SQLite和SqlSugar的使用

下一篇：算法学习014 0-1背包问题 c++动态规划算法实现中小学算法思维学习信奥算法解析

热门推荐

01如何新建文件夹？电脑新建文件夹的4种方法 02GitHub 镜像站点 032026年7月AI圈大地震：GPT-5.6被政府限制、Claude入驻Slack、Anthropic自研芯片 04国内可直接用、免费额度/永久免费的大模型API清单（含 SiliconFlow、火山、阿里、智谱、百度、Kimi、DeepSeek、DMXAPI 等）052026 国产 AI 大模型横评：DeepSeek、通义千问、Kimi、文心一言、星火、豆包谁更能打？06AI 编程 IDE 全景解析 2026：Agent 全面接管开发链路 07微信历史版本含下载地址（ Windows PC | 安卓 | MAC ）及设置微信不更新 08AI科技热点日报 | 2026年07月01日 09Agnes AI 免费 API 接入指南：文本、生图、生视频，一套接口全免费 102026上半年大模型全景技术解读：推理融合、Agent 爆发与多模态统一