GPT-5可能会在今年夏天作为对ChatGPT的“实质性改进”而到来

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

自从OpenAI一年前推出其GPT-4人工智能模型以来,该模型模仿人类沟通和作文的能力引发了巨大的热潮和存在性恐慌。从那时起,人工智能领域最大的问题仍然是:GPT-5何时发布?在全球的采访和媒体露面中,OpenAI的首席执行官Sam Altman经常被问到这个问题,他通常给出一个含糊或回避的答案,有时还伴随着对令人惊奇的未来的承诺。

根据Business Insider的一份新报告,预计OpenAI将在2024年中期某个时候发布GPT-5,这是一个改进版的人工智能语言模型,该模型驱动了ChatGPT,很可能在夏天。两个熟悉公司情况的匿名消息来源透露,一些企业客户最近收到了GPT-5及其对ChatGPT的相关增强功能的演示。

一位最近看过GPT-5版本的首席执行官形容它为"真的很好"和"质的飞跃",OpenAI使用针对其公司独特的用例和数据演示了新模型。这位首席执行官还暗示了该模型的其他未发布功能,例如能够启动OpenAI正在开发的执行自动任务的AI代理。

当被问及GPT-5的发布日期和Business Insider的报告时,OpenAI的代表回应说他们没有具体评论,但他们引用了Altman最近在Lex Fridman播客上的一段出场记录。

Lex Fridman(01:06:13)那么GPT-5何时再次发布?

Sam Altman(01:06:15)我不知道。这是真诚的回答。

Lex Fridman(01:06:18)哦,这是真诚的回答。如果是今年请眨两次眼睛。

Sam Altman(01:06:30)我们将在今年发布一个惊人的新模型。我不知道我们会叫它什么。

Lex Fridman(01:06:36)那就是关于我们如何发布这个东西的问题吗?

Sam Altman(01:06:41)我们将在接下来的几个月发布许多不同的东西。我认为那会非常酷。我认为在我们讨论一个类似GPT-5的模型之前,不管它是否被这样称呼,或者比你对GPT-5的期待略好或略差,我认为我们首先有很多其他重要的东西要发布。

在这次对话中,Altman似乎暗示公司准备在今年推出一个重大的AI模型,但是否将其称为"GPT-5"或视为GPT-4 Turbo的重大升级(或许是像GPT-4.5这样的渐进式更新)还未定。

与其前身一样,GPT-5(或无论它将被称为什么)预计将是一个多模态大型语言模型(LLM),可以接受文本或编码的视觉输入(称为"提示")。就像GPT-4一样,GPT-5将是一个下一个令牌预测模型,这意味着它将输出在序列中最有可能的下一个令牌(一个词的片段)的最佳估计,这允许执行任务,例如完成一个句子或编写代码。当以特定方式配置时,GPT模型可以为像ChatGPT这样的会话聊天机器人应用提供动力。

OpenAI在2023年3月发布了GPT-4,作为其最主要的前身GPT-3的升级,GPT-3在2020年出现(GPT-3.5在2022年底到来)。去年11月,OpenAI发布了GPT-4 Turbo,大幅降低了OpenAI最佳AI模型的推理(运行)成本,但一直饱受"懒惰"指控,模型有时拒绝回答提示或完成编码项目。OpenAI已经多次尝试解决懒惰问题。

像OpenAI开发的这样的LLM是在从互联网上抓取的大型数据集和从媒体公司获得的许可数据上训练的,使它们能够以类似人类的方式响应用户提示。然而,模型提供的信息质量可能根据使用的训练数据而变化,也基于模型编造信息的倾向。如果GPT-5能够改善泛化能力(执行新任务的能力)的同时减少业界通常称为"幻觉"的现象,它很可能代表该公司的一个显著进步。

据报道,OpenAI仍在训练GPT-5,在完成后,该模型将进行内部安全测试和进一步的"红队"测试,以识别并解决任何问题,然后才公开发布。根据安全测试过程持续的时间,发布日期可能会延迟。

当然,报告中的消息来源可能会出错,GPT-5可能会因测试之外的原因而推迟发布。因此,请将此视为一个强烈的传言,但这是我们首次从一个可信赖的来源看到关于GPT-5可能发布日期的信息。此外,现在我们知道据报道GPT-5已经完成到足够进行测试的阶段,这意味着其主要训练运行很可能已经完成。后续可能还会有更多的改进。

相关推荐
deephub几秒前
使用 PyTorch-BigGraph 构建和部署大规模图嵌入的完整教程
人工智能·pytorch·深度学习·图嵌入
deephub32 分钟前
优化注意力层提升 Transformer 模型效率:通过改进注意力机制降低机器学习成本
人工智能·深度学习·transformer·大语言模型·注意力机制
搏博44 分钟前
神经网络问题之二:梯度爆炸(Gradient Explosion)
人工智能·深度学习·神经网络
KGback1 小时前
【论文解析】HAQ: Hardware-Aware Automated Quantization With Mixed Precision
人工智能
电子手信1 小时前
知识中台在多语言客户中的应用
大数据·人工智能·自然语言处理·数据挖掘·知识图谱
不高明的骗子1 小时前
【深度学习之一】2024最新pytorch+cuda+cudnn下载安装搭建开发环境
人工智能·pytorch·深度学习·cuda
Chef_Chen1 小时前
从0开始学习机器学习--Day33--机器学习阶段总结
人工智能·学习·机器学习
搏博1 小时前
神经网络问题之:梯度不稳定
人工智能·深度学习·神经网络
GL_Rain1 小时前
【OpenCV】Could NOT find TIFF (missing: TIFF_LIBRARY TIFF_INCLUDE_DIR)
人工智能·opencv·计算机视觉
shansjqun2 小时前
教学内容全覆盖:航拍杂草检测与分类
人工智能·分类·数据挖掘