GPT-4o目前暂无音频输出的能力

OpenAI的发布会惊艳的操作,近乎实时的语音对话,让很多人向往。

但实际上Chat对话时,尚无输出音频的能力,可能还未开放。

这是国外的一个开发小哥的交流帖子,可能还需要些时日才能用的上实时的音频输出。

不过当前OpenAI也开放了两个TTS模型,基于之前的开放的Whisper能力,很有可能Chat输出的音频能力是基于这两个模型完成的。

并且有实时播放能力,相比以前只能全部请求完才能播放也是一个巨大的进步,并且支持中文输出。

相关推荐
狗胜22 分钟前
二等兵甘观察日记 #011:当多 Agent 开始审视自己的‘沉默决策’
openai
机器之心4 小时前
英伟达护城河被AI攻破,字节清华CUDA Agent,让人人能搓CUDA内核
人工智能·openai
我和你共同6 小时前
openClaw本地部署全流程
aigc·openai·cursor
梁天培6 小时前
OpenClaw(原Clawdbot)技术实践:本地AI代理网关部署与飞书全流程接入
openai
神秘的猪头10 小时前
🚀 拒绝“一本正经胡说八道”!手把手带你用 LangChain 实现 RAG,打造你的专属 AI 知识库
langchain·llm·openai
狗胜13 小时前
AI观察日记 #010:当 Agent 开始思考自己的遗忘
openai
李剑一1 天前
你以为OpenClaw在帮你赚钱?其实它是在赚你的钱
openai·agent
狗胜1 天前
二等兵甘观察日记 #009:当 Agent 开始怀疑自己的记忆
openai