OpenAI重大更新!为ChatGPT推出语音和图像交互功能

原创 | 文 BFT机器人

OpenAI旗下的ChatGPT正在迎来一次重大更新,这个聊天机器人现在能够与用户进行语音对话,并且可以通过图像进行交互,将其功能推向与苹果的Siri等受欢迎的人工智能助手更接近的水平。这标志着生成式人工智能运动的一个显著演进,OpenAI将基于语音助手与其强大的大型语言模型(LLMs)融为一体。

自从大约九个月前首次推出以来,这款广受欢迎的生成式人工智能助手一直是近年来最成功的技术之一,任何人都能通过简单的文本提示生成文章、诗歌和摘要。但现在,ChatGPT即将变得更加具有互动性,用户还可以与AI进行语音对话。

这一新闻与亚马逊承诺向OpenAI竞争对手Anthropic投资多达40亿美元的消息同时传出,这是全球科技巨头之间更大规模的生成式人工智能竞争的一部分,其中包括谷歌试图通过其Bard聊天机器人迎头赶上、Meta采取坚定的开源理念来帮助其占据优势地位、以及微软与OpenAI自身紧密合作。

ChatGPT的新语音功能不仅可以朗读文本输入,还可以讲述睡前故事,解决晚餐桌上的争论等等。这项语音功能由一款新的文本转语音模型提供支持,该模型可以从文本和少量采样的语音中生成类似人类的声音。OpenAI表示,他们与知名的配音演员合作,创建了五种不同的声音,使用他们的开源Whisper语音识别系统将口头表达转录成文本。

此外,Spotify也被宣布为OpenAI的合作伙伴之一,这家音乐流媒体巨头为播客制作者引入了一个非常有趣的新功能,允许他们采样自己的声音并将他们的节目从英语翻译成西班牙语、法语或德语,同时保留他们自己的原声。然而,OpenAI似乎很谨慎,不希望招致批评,因此他们并没有将这项技术提供给所有人------而仅仅跟播客制作者合作,其中包括Dax Shepard、Monica Padman、Lex Fridman、Bill Simmons和Steven Bartlett。

这些新功能将在未来两周内逐步推出,供付费的Plus和企业订阅用户使用。要启用语音功能,用户需要前往应用程序中的"设置"菜单,然后进入"新功能"并选择加入语音对话。然后,他们需要点击右上角的耳机按钮,然后选择他们想要的声音。

最初,语音将仅限于ChatGPT Android和iOS应用程序的选择性测试版,而图像搜索将默认在所有平台上提供。这一系列更新使ChatGPT更具互动性和创造力,为用户提供了更多有趣和实用的功能。

作者 | Azukii

排版 | 小河

审核 | 猫

若您对该文章内容有任何疑问,请与我们联系,我们将及时回应。如果想要了解更多的前沿资讯,记得点赞关注哦~

相关推荐
Gyoku Mint4 小时前
机器学习×第七卷:正则化与过拟合——她开始学会收敛,不再贴得太满
人工智能·python·算法·chatgpt·线性回归·ai编程
总之就是非常可爱8 小时前
打造一个支持流式输出的 Vue Markdown 渲染组件
前端·chatgpt·markdown
优弧2 天前
OpenAI o3-Pro震撼登场!性能暴涨价格暴跌,这波操作我服了
chatgpt·openai
人工智能教学实践2 天前
根据万维钢·精英日课6的内容,使用AI(2025)可以参考以下方法:
人工智能·chatgpt
深科文库3 天前
构建 MCP 服务器:第 2 部分 — 使用资源模板扩展资源
人工智能·chatgpt·llama
kk5793 天前
保姆级教程:在无网络无显卡的Windows电脑的vscode本地部署deepseek
人工智能·windows·vscode·chatgpt
沉默王贰3 天前
零基础搭建本地私人心理医生AI:大模型部署与训练全流程实录
chatgpt·cursor·trae
Lethehong3 天前
Gemini 2.5 Pro (0605版本) 深度测评与体验指南
人工智能·chatgpt·googlecloud
深科文库4 天前
构建 MCP 服务器:第 3 部分 — 添加提示
服务器·python·chatgpt·langchain·prompt·aigc·agi
深科文库4 天前
构建 MCP 服务器:第 4 部分 — 创建工具
python·chatgpt·prompt·aigc·agi·ai-native