GPT-4o目前暂无音频输出的能力

OpenAI的发布会惊艳的操作,近乎实时的语音对话,让很多人向往。

但实际上Chat对话时,尚无输出音频的能力,可能还未开放。

这是国外的一个开发小哥的交流帖子,可能还需要些时日才能用的上实时的音频输出。

不过当前OpenAI也开放了两个TTS模型,基于之前的开放的Whisper能力,很有可能Chat输出的音频能力是基于这两个模型完成的。

并且有实时播放能力,相比以前只能全部请求完才能播放也是一个巨大的进步,并且支持中文输出。

相关推荐
爱吃的小肥羊6 小时前
Codex 被 OpenAI 做成插件,塞进了 Claude Code,这招绝了!
openai·ai编程
魁首8 小时前
Claude Code 源码泄露的背后,到底与Codex,Gemini 有啥不一样?
前端·openai·claude
机器之心9 小时前
京东卷出新高度!硬刚「复杂指令」长时长、自由态数字人直播终于丝滑了
人工智能·openai
机器之心9 小时前
龙虾太难养?发布的SOLO独立端,可能是你要的AI生产力
人工智能·openai
DigitalOcean11 小时前
当所有人都在讨论 AI 工具时,我们已经用 AI 跑通了一家公司
openai·agent·claude
嵌入式-小王11 小时前
OpenAI库的基础使用
llm·openai
Lupino12 小时前
实测 Codex:它是如何精准地把“正常代码”修出死循环的?
openai·haskell
树獭叔叔13 小时前
Agent 记忆系统设计全景:从短期对话到长期知识沉淀
后端·aigc·openai
二等饼干~za89866815 小时前
豆包GEO优化源码开发全解析:技术架构、实现逻辑与实操指南
数据库·sql·重构·架构·mybatis·音视频
枳实-叶15 小时前
嵌入式音视频开发——视频码率与码率控制技术
音视频