OpenAI 推迟了 ChatGPT 的新语音模式

今年 5 月,OpenAI 首次为其人工智能聊天机器人平台ChatGPT演示了一种非常逼真、近乎实时的"高级语音模式"。几个月后,OpenAI 表示需要更多时间。

OpenAI 在其官方 Discord 服务器上发布了一篇文章,称其原计划于 6 月底开始向一小部分ChatGPT Plus用户推出高级语音模式的Alpha版,但由于一些问题迟迟得不到解决,不得不将推出时间推迟到 7 月。

"例如,我们正在提高模型检测和拒绝某些内容的能力,"OpenAI 写道。"我们还在努力改善用户体验,并准备将我们的基础设施扩展到数百万,同时保持实时响应。作为我们迭代部署策略的一部分,我们将从一小群用户开始进行阿尔法测试,以收集反馈,并根据我们所学到的知识进行扩展。"

OpenAI 表示,高级语音模式可能要到秋季才会面向所有 ChatGPT Plus 客户推出,这取决于它是否满足某些内部安全性和可靠性检查的要求。不过,这一延迟不会影响在 OpenAI 春季新闻发布会上单独演示的新视频和屏幕共享功能的推出。

这些功能包括根据问题图片解决数学问题,以及解释设备上的各种设置菜单。这些功能不仅适用于智能手机上的 ChatGPT,也适用于桌面客户端,比如 MacOS 应用程序,今天早些时候,所有 ChatGPT 用户都可以使用该应用程序。

"ChatGPT先进的语音模式可以理解情绪和非语言线索并做出反应,让我们更接近与人工智能进行实时、自然的对话,"OpenAI写道。"我们的使命是将这些新体验深思熟虑地带给您。"

在发布会的舞台上,OpenAI 的员工展示了 ChatGPT 对请求的即时响应,例如在研究人员智能手机摄像头前的一张纸上解决一道数学题。

OpenAI 的高级语音模式因默认的"Sky"语音与女演员斯嘉丽-约翰逊(Scarlett Johansson)的语音相似而引发了不少争议。约翰逊后来发表声明说,她聘请了法律顾问来询问有关语音的问题,并获得了关于如何开发语音的确切细节--她拒绝了 OpenAI 关于授权她为 ChatGPT 配音的多次请求。

OpenAI 虽然否认在未经许可的情况下使用了约翰逊的声音,也没有使用相似的声音,但随后删除了违规的声音。

感谢大家花时间阅读我的文章,你们的支持是我不断前进的动力。期望未来能为大家带来更多有价值的内容,请多多关注我的动态!

相关推荐
摆烂工程师18 小时前
建议定时备份 ChatGPT 聊天记录,在 GPT 封号前降低损失
chatgpt·openai·ai编程
Raink老师18 小时前
【AI面试临阵磨枪】详细解释 Transformer 架构的核心组件与工作流程。
人工智能·深度学习·transformer·ai 面试·ai 应用开发
qcx2319 小时前
【AI Agent实战】OpenClaw 安全加固完全指南:安全攻击手段与五步防护实践(2026最新)
人工智能·安全
码农小白AI19 小时前
AI报告审核进入技术驱动时代:IACheck如何从规则引擎走向深度学习,构建检测报告审核“技术矩阵”
人工智能·深度学习
song1502653729819 小时前
视觉检测设备:自动识别缺陷、尺寸、瑕疵、装配错误,一键全检
人工智能·计算机视觉·视觉检测
智能化咨询19 小时前
(163页PPT)某著名企业K3生产制造售前营销指导方案P164(附下载方式)
大数据·人工智能
Zzj_tju19 小时前
大语言模型技术指南:SFT、RLHF、DPO 怎么串起来?对齐训练与关键参数详解
人工智能·深度学习·语言模型
金智维科技官方19 小时前
RPA技术赋能电信运营商话单稽核:金智维如何驱动高精度自动化转型
人工智能·自动化·数字化·rpa·智能体·电信
2501_9481142420 小时前
2026模型能力分化加剧:多模型聚合架构的技术解析与工程落地思考
人工智能·ai·chatgpt·架构
新知图书21 小时前
LangGraph中的记忆存储
人工智能·langgraph·智能体设计·多智能体设计