亚马逊秘密研发 AI 对标 ChatGPT;语音 AI 未来五年或将释放 100 亿美元市场 丨 RTE 开发者日报

开发者朋友们大家好:

这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。

我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 新闻 」、「有态度的 观点 」、「有意思的 数据 」、「有思考的 文章 」、「有看点的会议」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@CY,@JLT,@鲍勃

一、有话题的新闻

1、BVP 报告:语音 AI 应用将在未来五年内释放 100 亿美元的新软件 TAM

近日,BVP 发布了《State of the Cloud 2024》报告,并深入探讨了塑造 AI 云经济未来的五大趋势,以及对 2030 年前景的预测。

其中趋势之一:多模态模型和 AI Agent 将改变人类与软件的关系。

多模态模型和 AI Agent 的兴起正在引领 AI 创新的下一波浪潮,并大大扩展了 AI 的潜在应用范围,比早期基于文本的模型实现的应用要广泛得多。对于 AI 企业家来说,在新的模态(如语音、图像和视频)以及 Agent 工作流中创新是一个全新的机会。这些新模态赋予了 AI 类似于人类的视觉、听觉和语言能力,这为 AI 在依赖这些感官的大量人类工作中扮演辅助角色提供了机会。

在接下来的 12 个月里, BVP 预计语音 AI 应用将出现爆发性增长。从长远来看, BVP 还看到了以 Agent 为核心的产品有望改变企业运营方式,因为它们设定了 AI 可以处理的任务复杂性和广度的新期望。

多模态模型和 AI Agent 将改变人类与软件的关系,语音 AI 应用预计将在未来五年内释放 100 亿美元的新软件 TAM。(@有新 Newin)

2、OpenAI 的 ChatGPT Mac 版应用已向所有用户开放,支持语音对话

6 月 26 日消息,OpenAI 公司宣布,其首款适用于 Mac 的 ChatGPT 聊天机器人应用正式面向所有用户开放下载。此前一个月,该应用一直处于测试阶段,仅 Plus 付费订阅用户可以使用。

OpenAI 称,ChatGPT 的 Mac 应用旨在与用户日常操作无缝集成,其原生支持 Mac 系统,并提供方便的快捷键 (Command + 空格键) 允许用户随时随地启动应用。用户可以轻松与聊天机器人进行交互,并可选择将文件、照片和屏幕截图等附加到您的信息中,供 ChatGPT 使用这些素材进行理解和创作。

该应用还支持「语音模式」,用户可以使用语音与 ChatGPT 进行交流。OpenAI 表示,将在未来几周内为 Mac 用户提供支持 GPT-4o 功能的新「语音模式」版本。(@IT 之家)

3、曝亚马逊秘密研发 AI 对标 ChatGPT,可制定度假行程、控制智能家居设备,甚至预订航班

据外媒报道,科技巨头亚马逊正在秘密研发一款人工智能聊天机器人,代号为「Metis」,目标直指 OpenAI 旗下的知名产品 ChatGPT。知情人士称,这是亚马逊此前发布的「Titan」模型的升级版,功能更加强大。内部文件显示,Metis 能够以一种智能对话的方式回答文本和图像相关的问题,并提供相应的信息来源链接,推荐后续查询,甚至生成图像。

更重要的是,亚马逊希望 Metis 能够利用一种名为「检索增强生成」(retrieval-augmented generation)的人工智能技术,这将使其能够获取超出其训练数据之外的信息,从而生成最新的信息。例如,Metis 能提供最新的股票价格,而一些不具备该技术的聊天机器人则无法做到这一点。Metis 不仅能作为信息助手,还能胜任人工智能代理人的角色。这意味着它可以根据现有数据自动执行复杂任务,比如制定度假行程、控制智能家居设备,甚至预订航班。(@IT 之家)

4、美国大型唱片公司联手起诉 AI 音乐生成器 Suno 和 Udio 侵犯版权

据外媒报道,三家主要的唱片公司索尼音乐、环球音乐和华纳音乐本周一起诉人工智能公司 Suno 和 Udio,指控它们通过使用这些唱片公司的录音来训练音乐生成式 AI 系统,犯下大规模版权侵权行为。诉讼中,三家唱片公司提到,Suno 和 Udio 在未经许可的情况下复制音乐,训练他们的系统创作音乐,这些音乐将「直接与人类艺术家的作品竞争、贬值并最终淹没」人类艺术家的作品。

对此唱片公司要求法院判处每首歌 15 万美元的法定赔偿金,并指控 Suno 复制了 662 首歌曲,Udio 复制了 1670 首。对此 Suno 首席执行官 Mikey Shulman 回应:「我们的技术具有变革性,它旨在生成全新的输出,而不是记住和重复现有内容。」(@IT 之家)

5、Google 将推出明星网红 AI 聊天机器人

据外媒 The Information 报道,Google 将推出明星网红 AI 聊天机器人。有两位知情人士表示,Google 将基于 Gemini 大语言模型,打造这款明星网红 AI 聊天机器人。

Google 还在尝试开发一项功能,让用户能够以自定义的方式来创建自己的 AI 聊天机器人。

报道中指出,Google 的想法并不是首例,已经有 Character.ai、 Meta 等公司推出了类似的产品。(@爱范儿)

6、OpenAI API 国内不能用了,国产大模型纷纷推出「平替」搬家方案

6 月 25 日消息,OpenAI 官方推送的邮件通知中指出,自 7 月 9 日起,OpenAI 将开始阻止来自非支持国家和地区的 API 流量。受影响组织若希望继续使用 OpenAI 的服务,必须在其支持的国家或地区内访问。

OpenAI 的这一禁令通知,让国内一众大模型厂商们都兴奋起来,争先恐后的推出了「搬家」服务------使用 OpenAI API 构建产品或服务的企业可以「无缝」将业务搬到自家大模型。百度智能云千帆宣布推出「0 元迁移及 0 元服务等多项免费服务」、阿里云百炼表示将提供「最具性价比的中国大模型替代方案」、智谱宣布「特别搬家计划」、零一万物宣布「Yi API 二折平替计划」、百川智能宣布推出「OpenAI 零成本迁移计划」等等。(@TechWeb)

二、有态度的观点

1、何小鹏:相信 2025 会是完全自动驾驶的 ChatGPT 时刻

6 月 25 日晚间消息,小鹏汽车董事长何小鹏今日在微博上发布在美体验特斯拉 FSD 视频,称小鹏智驾能跟特斯拉掰手腕。何小鹏表示,「在旧金山城区 Waymo 表现更好,而 FSD 在硅谷和高速表现极好,可以达到很高的分数,很多路况处理都很丝滑。」

小鹏自动驾驶负责人李力耘随后在微博上表示,很期待 FSD 进入中国后的实际体验,也很期待让 XNGP 和 FSD 同台比拼。

何小鹏还表示,非常感慨 FSD 在数月里有很大的进步,小鹏也会向 FSD 学习他们优秀的功能点和用户体验部分,「我相信 2025 会是完全自动驾驶的 ChatGPT 时刻。」(@新浪科技)

写在最后:

我们欢迎更多的小伙伴参与 「RTE 开发者日报」 内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

素材来源官方媒体/网络新闻

相关推荐
B站计算机毕业设计超人39 分钟前
计算机毕业设计PySpark+Hadoop中国城市交通分析与预测 Python交通预测 Python交通可视化 客流量预测 交通大数据 机器学习 深度学习
大数据·人工智能·爬虫·python·机器学习·课程设计·数据可视化
学术头条43 分钟前
清华、智谱团队:探索 RLHF 的 scaling laws
人工智能·深度学习·算法·机器学习·语言模型·计算语言学
18号房客1 小时前
一个简单的机器学习实战例程,使用Scikit-Learn库来完成一个常见的分类任务——**鸢尾花数据集(Iris Dataset)**的分类
人工智能·深度学习·神经网络·机器学习·语言模型·自然语言处理·sklearn
feifeikon1 小时前
机器学习DAY3 : 线性回归与最小二乘法与sklearn实现 (线性回归完)
人工智能·机器学习·线性回归
游客5201 小时前
opencv中的常用的100个API
图像处理·人工智能·python·opencv·计算机视觉
古希腊掌管学习的神1 小时前
[机器学习]sklearn入门指南(2)
人工智能·机器学习·sklearn
凡人的AI工具箱1 小时前
每天40分玩转Django:Django国际化
数据库·人工智能·后端·python·django·sqlite
咸鱼桨2 小时前
《庐山派从入门到...》PWM板载蜂鸣器
人工智能·windows·python·k230·庐山派
强哥之神2 小时前
Nexa AI发布OmniAudio-2.6B:一款快速的音频语言模型,专为边缘部署设计
人工智能·深度学习·机器学习·语言模型·自然语言处理·音视频·openai
yusaisai大鱼2 小时前
tensorflow_probability与tensorflow版本依赖关系
人工智能·python·tensorflow