GPT-4o目前暂无音频输出的能力

OpenAI的发布会惊艳的操作,近乎实时的语音对话,让很多人向往。

但实际上Chat对话时,尚无输出音频的能力,可能还未开放。

这是国外的一个开发小哥的交流帖子,可能还需要些时日才能用的上实时的音频输出。

不过当前OpenAI也开放了两个TTS模型,基于之前的开放的Whisper能力,很有可能Chat输出的音频能力是基于这两个模型完成的。

并且有实时播放能力,相比以前只能全部请求完才能播放也是一个巨大的进步,并且支持中文输出。

相关推荐
博客zhu虎康5 分钟前
音视频处理:视频时间轴在指定时间处添加音频并展示可视化拖拽条
音视频
大学生小郑5 分钟前
亮度噪声和色度噪声
图像处理·音视频·视频
星海之恋99212 分钟前
便宜又好用的移动 4G 蜂窝代理快来看看!
音视频
传说故事37 分钟前
【论文自动阅读】视频生成模型的Inference-time物理对齐 with Latent World Model
人工智能·深度学习·音视频·视频生成
Bits to Atoms1 小时前
宇树G1语音助手完整开发指南(下)——从零构建智能知识库对话系统
人工智能·机器人·音视频·语音识别
行业探路者2 小时前
2026年热销榜单:富媒体展示二维码推荐,助力信息传递新风尚
大数据·音视频·二维码
大学生小郑2 小时前
影像测评知识分享
图像处理·音视频·视频
枫叶丹42 小时前
【Qt开发】Qt系统(十一)-> Qt 音频
c语言·开发语言·c++·qt·音视频
发哥来了2 小时前
主流AI视频生成商用方案选型评测:关键能力与成本效益分析
大数据·人工智能·音视频
sweetone2 小时前
Rogers(乐爵士)A75 Series 2 功放之再修
经验分享·音视频