GPT-4o目前暂无音频输出的能力

OpenAI的发布会惊艳的操作,近乎实时的语音对话,让很多人向往。

但实际上Chat对话时,尚无输出音频的能力,可能还未开放。

这是国外的一个开发小哥的交流帖子,可能还需要些时日才能用的上实时的音频输出。

不过当前OpenAI也开放了两个TTS模型,基于之前的开放的Whisper能力,很有可能Chat输出的音频能力是基于这两个模型完成的。

并且有实时播放能力,相比以前只能全部请求完才能播放也是一个巨大的进步,并且支持中文输出。

相关推荐
feiyangqingyun2 小时前
Qt音视频开发技巧/推流带旋转角度/rtsprtmp推流/保存文件到MP4/拉流解析旋转角度
qt·音视频·qt旋转角度推流
Despacito0o2 小时前
ESP32-s3摄像头驱动开发实战:从零搭建实时图像显示系统
人工智能·驱动开发·嵌入式硬件·音视频·嵌入式实时数据库
知了一笑2 小时前
SpringBoot3集成多款主流大模型
spring boot·后端·openai
楽码3 小时前
终于说清楚!希腊字符如何进入数学或科学场景
openai·编程语言·trae
临界点oc9 天前
SpringAI + DeepSeek大模型应用开发 - 进阶篇(上)
openai·springai·阿里百炼
伊泽瑞尔10 天前
打造极致聊天体验:uz-chat——全端AI聊天组件来了!
后端·chatgpt·openai
量子位10 天前
OpenAI 硬件陷 “抄袭门”,商标 / 设计极其相似,官方火速删帖
openai
新智元10 天前
任务太难,连 ChatGPT 都弃了!最强 AI 神器一键拆解,首测来袭
人工智能·openai
新智元10 天前
特斯拉 Robotaxi 首秀翻车!逆行急刹吓哭网友,半路抛客全程高能预警
人工智能·openai
chengliu050810 天前
SSE(Server-Sent Events)实现ai对话框
openai