OpenAI重大更新!为ChatGPT推出语音和图像交互功能

原创 | 文 BFT机器人

OpenAI旗下的ChatGPT正在迎来一次重大更新,这个聊天机器人现在能够与用户进行语音对话,并且可以通过图像进行交互,将其功能推向与苹果的Siri等受欢迎的人工智能助手更接近的水平。这标志着生成式人工智能运动的一个显著演进,OpenAI将基于语音助手与其强大的大型语言模型(LLMs)融为一体。

自从大约九个月前首次推出以来,这款广受欢迎的生成式人工智能助手一直是近年来最成功的技术之一,任何人都能通过简单的文本提示生成文章、诗歌和摘要。但现在,ChatGPT即将变得更加具有互动性,用户还可以与AI进行语音对话。

这一新闻与亚马逊承诺向OpenAI竞争对手Anthropic投资多达40亿美元的消息同时传出,这是全球科技巨头之间更大规模的生成式人工智能竞争的一部分,其中包括谷歌试图通过其Bard聊天机器人迎头赶上、Meta采取坚定的开源理念来帮助其占据优势地位、以及微软与OpenAI自身紧密合作。

ChatGPT的新语音功能不仅可以朗读文本输入,还可以讲述睡前故事,解决晚餐桌上的争论等等。这项语音功能由一款新的文本转语音模型提供支持,该模型可以从文本和少量采样的语音中生成类似人类的声音。OpenAI表示,他们与知名的配音演员合作,创建了五种不同的声音,使用他们的开源Whisper语音识别系统将口头表达转录成文本。

此外,Spotify也被宣布为OpenAI的合作伙伴之一,这家音乐流媒体巨头为播客制作者引入了一个非常有趣的新功能,允许他们采样自己的声音并将他们的节目从英语翻译成西班牙语、法语或德语,同时保留他们自己的原声。然而,OpenAI似乎很谨慎,不希望招致批评,因此他们并没有将这项技术提供给所有人------而仅仅跟播客制作者合作,其中包括Dax Shepard、Monica Padman、Lex Fridman、Bill Simmons和Steven Bartlett。

这些新功能将在未来两周内逐步推出,供付费的Plus和企业订阅用户使用。要启用语音功能,用户需要前往应用程序中的"设置"菜单,然后进入"新功能"并选择加入语音对话。然后,他们需要点击右上角的耳机按钮,然后选择他们想要的声音。

最初,语音将仅限于ChatGPT Android和iOS应用程序的选择性测试版,而图像搜索将默认在所有平台上提供。这一系列更新使ChatGPT更具互动性和创造力,为用户提供了更多有趣和实用的功能。

作者 | Azukii

排版 | 小河

审核 | 猫

若您对该文章内容有任何疑问,请与我们联系,我们将及时回应。如果想要了解更多的前沿资讯,记得点赞关注哦~

相关推荐
Joseph Cooper2 分钟前
大模型微调技术完全指南:从原理到实践的系统性入门(2026 版)
人工智能·chatgpt·lora·peft·qlora·大模型微调·dpo
YJlio7 分钟前
8.2Windows 11 如何用 Xbox Game Bar 实时监测电脑性能?CPU、内存、GPU、显存与 FPS 瓶颈判断教程
windows·笔记·学习·chatgpt·架构·电脑·xbox
云天AI实战派1 小时前
AI智能体总是跑偏怎么办?ChatGPT/API 调用排查指南:从工具路由到语音闭环的全流程修复手册
人工智能·chatgpt·aigc
A8ai21 小时前
OpenAI发布GPT-5.5-Cyber:网络安全专用模型的全面解析
gpt·ai·chatgpt
我是发哥哈1 天前
东莞AI培训主流方案横向评测:5大选型维度解析
大数据·人工智能·学习·机器学习·chatgpt·ai编程
野生的程序媛2 天前
关于我做了一个玩偶姐姐桌宠
人工智能·深度学习·神经网络·机器学习·chatgpt·ai作画·gpt-3
ZGi.ai2 天前
AI中台和AI工具的区别:为什么说前者是基础设施而后者是应用
人工智能·chatgpt·ai工具·ai基础设施
我是发哥哈2 天前
深度评测:五款主流AI培训平台的课程交付能力对比
大数据·人工智能·学习·机器学习·ai·chatgpt
huisheng_qaq2 天前
【AI入门篇-02】深入理解ChatGPT发展流程
人工智能·gpt·ai·chatgpt·大模型·transfomer
月诸清酒3 天前
51-260503 AI 科技日报 (ChatGPT图像功能用户量暴涨,新用户占六成)
人工智能·chatgpt