GPT-4o目前暂无音频输出的能力

OpenAI的发布会惊艳的操作,近乎实时的语音对话,让很多人向往。

但实际上Chat对话时,尚无输出音频的能力,可能还未开放。

这是国外的一个开发小哥的交流帖子,可能还需要些时日才能用的上实时的音频输出。

不过当前OpenAI也开放了两个TTS模型,基于之前的开放的Whisper能力,很有可能Chat输出的音频能力是基于这两个模型完成的。

并且有实时播放能力,相比以前只能全部请求完才能播放也是一个巨大的进步,并且支持中文输出。

相关推荐
人工智能培训咨询叶梓33 分钟前
Lumière:开创性的视频生成模型及其应用
人工智能·深度学习·机器学习·语言模型·自然语言处理·音视频·多模态
玩电脑的辣条哥1 小时前
如何快速去除视频里面的水印字幕等信息?(内附工具)
ai·音视频·短视频
Susu_afmx1 小时前
音乐伴奏提取?唱歌剪辑好用的音频人声分离软件!提取步骤很简单!
深度学习·新媒体运营·电脑·音视频·音频
星星月亮03 小时前
iOS Swift5 视频播放 能播放各种编码格式的视频的第三方库
ios·音视频
爱玩游戏的jason5 小时前
如何获取音频伴奏
音视频
写代码的小黑15 小时前
视频添加字幕
python·音视频
Leventure_轩先生15 小时前
[ALSA]从零开始,使用ALSA驱动播放一个音频
开发语言·c++·音视频
智光工作室18 小时前
AudioLM音频生成模型
音视频·audiolm
营赢盈英20 小时前
use embeddings stored in vector db to reduce work for LLM generating response
python·langchain·llm·vector·openai·database
JoyceMill20 小时前
Android音频捕捉技术探索与实践
android·音视频