OpenAI 的 GPT-4 更好模型 Claude 3.0 来了

Google 最近发布了最新的 Gemini 1.5 语言模型，震惊了世界。这是目前功能最强大的模型，拥有 100 万个上下文窗口，是所有大型基础模型中最大的。 OpenAI 的 GPT-4 才具有 128K 上下文窗口。

最近，谷歌最接近的竞争对手之一 Anthropic 发布了下一个版本的人工智能聊天机器人 Claude 3.0。

Claude 3.0 是继去年发布 Claude 2.0 之后，Anthropic 主要语言模型的最新版本。这是一次重大升级，具有三种不同大小的新 model ：

Opus 模型声称甚至比 OpenAI 的 GPT-4 更好，通过改进许多不同任务的能力以及对理解图像的新支持，此版本标志着 Anthropic 向前迈出了一大步。

Claude 3.0 中最大的新增功能是支持理解图像、图表、手写等以及文本。以下是视觉功能的一些用例：

根据 Anthropic 的基准测试，Claude 3.0 的视觉性能与其他具有视觉理解能力的领先语言模型相当，有时甚至更好。

Claude 3.0 的另一个重大改进是减少了不必要的 refusals ，这是之前的 Claude 2.0 中最烦人的功能之一。

Claude 3.0 版本的一项新功能是，它针对不同的用例和预算提供了三种不同大小的模型：

在下图中，Claude 3.0 Opus 在各种语言、推理和编码任务上似乎都优于 OpenAI 的 GPT-4。

Anthropic 的 Claude 3.0 基准测试

然而，基准测试显示了 Claude 3.0 仍然存在问题的领域，例如图表和图形等数据可视化的高级数学推理。目前还不清楚哪种模型总体上更适合通用智能。

Claude 3 最令人兴奋的功能之一是它能够处理极长的输入，同时保持对细节的精确记忆，主要体现在以下三点。

Claude 3 非常令人印象深刻，但根据早期测试，它仍然面临几个关键限制。

从现在开始，人们可以期望越来越多的模型支持极长的上下文窗口，扩展到数百万个 Token ，那么这将是一种革命性的能力。为构建强大的应用程序提供了巨大的潜力，这些应用程序利用这些语言人工智能增强的多模式和推理能力。

译自：medium.com/generative-...