GPT-4o目前暂无音频输出的能力

OpenAI的发布会惊艳的操作,近乎实时的语音对话,让很多人向往。

但实际上Chat对话时,尚无输出音频的能力,可能还未开放。

这是国外的一个开发小哥的交流帖子,可能还需要些时日才能用的上实时的音频输出。

不过当前OpenAI也开放了两个TTS模型,基于之前的开放的Whisper能力,很有可能Chat输出的音频能力是基于这两个模型完成的。

并且有实时播放能力,相比以前只能全部请求完才能播放也是一个巨大的进步,并且支持中文输出。

相关推荐
ujainu小13 小时前
Flutter 视频播放全攻略:video_player 2.10.1 插件全平台集成与实战
flutter·音视频
AI大模型学徒13 小时前
腾讯云视频通话Demo跑通教程
音视频·腾讯云
却道天凉_好个秋16 小时前
音视频学习(七十五):视频压缩:量化
音视频·视频压缩
却道天凉_好个秋17 小时前
音视频学习(七十六):熵编码
音视频·视频压缩
程序猿追18 小时前
在昇腾NPU上实战部署LongCat-Video:从环境配置到长视频生成的完整指南
python·大模型·华为云·音视频
Yutengii18 小时前
小红书的视频怎么下载到本地,实测6款下载工具
音视频
非凡ghost18 小时前
Topaz Video(人工智能视频增强软件)
人工智能·windows·学习·音视频·软件需求
zbguolei18 小时前
Windows平台下SRS实时视频服务器的搭建
服务器·windows·音视频
骄傲的心别枯萎18 小时前
RV1126 NO.58:ROCKX+RV1126人脸识别推流项目之读取人脸数据库并保存到map
linux·数据库·计算机视觉·音视频·rv1126
萌虎不虎1 天前
【在鸿蒙系统中实现录制视频预览功能】
华为·音视频·harmonyos