GPT-4o目前暂无音频输出的能力

OpenAI的发布会惊艳的操作,近乎实时的语音对话,让很多人向往。

但实际上Chat对话时,尚无输出音频的能力,可能还未开放。

这是国外的一个开发小哥的交流帖子,可能还需要些时日才能用的上实时的音频输出。

不过当前OpenAI也开放了两个TTS模型,基于之前的开放的Whisper能力,很有可能Chat输出的音频能力是基于这两个模型完成的。

并且有实时播放能力,相比以前只能全部请求完才能播放也是一个巨大的进步,并且支持中文输出。

相关推荐
新智元24 分钟前
毕树超入职Meta后首发声:十年前怀疑AGI,如今深信AGI已至!
人工智能·openai
新智元25 分钟前
GPT-5「全家桶」爆出本周上线!惊艳首测秒出网页,编程彻底起飞
人工智能·openai
小木木爸3 小时前
HLS视频切片音频中断问题分析与解决方案
音视频·hls视频切片·音频中断问题
lovep117 小时前
CLAP文本-音频基础模型: LEARNING AUDIO CONCEPTS FROM NATURAL LANGUAGE SUPERVISION
音视频·语音识别·多模态模型·音频识别·基础模型
安思派Anspire18 小时前
智能体AI中的提示工程与上下文工程
aigc·openai·agent
liuhaikang18 小时前
【鸿蒙HarmonyOS Next App实战开发】视频提取音频
华为·音视频·harmonyos
哪吒编程1 天前
炸裂!OpenAI GPT-5提前泄露?最强模型诞生
openai
中等生1 天前
ReAct: 减少 LLM 幻觉,提升准确度
llm·openai·ai编程
Java陈序员1 天前
轻松处理证件照!又一款 AI 证件照制作工具!
openai·ai编程·aiops
LinXunFeng1 天前
AI - Gemini CLI 摆脱终端限制
openai·ai编程·gemini