OpenAI 的 GPT-4 更好模型 Claude 3.0 来了

Google 最近发布了最新的 Gemini 1.5 语言模型,震惊了世界。这是目前功能最强大的模型,拥有 100 万个上下文窗口,是所有大型基础模型中最大的。 OpenAI 的 GPT-4 才具有 128K 上下文窗口。

最近,谷歌最接近的竞争对手之一 Anthropic 发布了下一个版本的人工智能聊天机器人 Claude 3.0

什么是 Claude 3.0

Claude 3.0 是继去年发布 Claude 2.0 之后,Anthropic 主要语言模型的最新版本。这是一次重大升级,具有三种不同大小的新 model :

  • Claude 3.0 Opus 最大
  • Claude 3.0 Sonic
  • Claude 3.0 HiQ

Opus 模型声称甚至比 OpenAI 的 GPT-4 更好,通过改进许多不同任务的能力以及对理解图像的新支持,此版本标志着 Anthropic 向前迈出了一大步。

Claude 3.0 有什么新功能?

Claude 3.0 中最大的新增功能是支持理解图像、图表、手写等以及文本。以下是视觉功能的一些用例:

  • 从图像中读取文本(OCR)
  • 分析图像内容
  • 解释数据可视化

根据 Anthropic 的基准测试,Claude 3.0 的视觉性能与其他具有视觉理解能力的领先语言模型相当,有时甚至更好。

Claude 3.0 的另一个重大改进是减少了不必要的 refusals ,这是之前的 Claude 2.0 中最烦人的功能之一。

3个新的Models

Claude 3.0 版本的一项新功能是,它针对不同的用例和预算提供了三种不同大小的模型:

  • Claude 3.0 Opus:最大、最强大的 model,适用于最苛刻的应用。 Opus 是拉丁语,意思是伟大的作品或杰作。
  • Claude 3.0 Sonic:中型 model,非常适合大多数一般商业和消费者需求。
  • Claude 3.0 HiQ:紧凑型 model,用于更简单的任务并在移动设备上使用。 HiQ 取自 "高品质"。

在下图中,Claude 3.0 Opus 在各种语言、推理和编码任务上似乎都优于 OpenAI 的 GPT-4。

Anthropic 的 Claude 3.0 基准测试

然而,基准测试显示了 Claude 3.0 仍然存在问题的领域,例如图表和图形等数据可视化的高级数学推理。目前还不清楚哪种模型总体上更适合通用智能。

Claude 3 最令人兴奋的功能之一是它能够处理极长的输入,同时保持对细节的精确记忆,主要体现在以下三点。

  • Claude 3 提供了 200,000 个 Token 的上下文窗口
  • 这些模型实际上可以处理超过 100 万个 Token
  • Anthropic 可以为某些高需求用途启用此 1M 上下文

Claude 3.0 的局限性

Claude 3 非常令人印象深刻,但根据早期测试,它仍然面临几个关键限制。

  • 它难以进行高级数学推理,尤其是图表和图形等数据可视化
  • 与以前的语言模型类似,某些输出存在种族偏见和不一致
  • 缺乏现实世界传感器和数据的基础,因此可能会产生训练领域之外的难以置信的信息
  • 尽管加强了安全控制以限制不道德/非法输出,但滥用的可能性仍然存在

总结

从现在开始,人们可以期望越来越多的模型支持极长的上下文窗口,扩展到数百万个 Token ,那么这将是一种革命性的能力。为构建强大的应用程序提供了巨大的潜力,这些应用程序利用这些语言人工智能增强的多模式和推理能力。

译自:medium.com/generative-...

相关推荐
大耳朵爱学习1 小时前
掌握Transformer之注意力为什么有效
人工智能·深度学习·自然语言处理·大模型·llm·transformer·大语言模型
洛阳泰山2 小时前
如何使用Chainlit让所有网站快速嵌入一个AI聊天助手Copilot
人工智能·ai·llm·copilot·网站·chainlit·copliot
营赢盈英13 小时前
Allow anonymous access to my Azure OpenAI chat bot
ai·openai·azure·webapps
数据智能老司机17 小时前
从零开始构建大型语言模型——微调用于分类
深度学习·神经网络·llm
大耳朵爱学习19 小时前
大模型预训练的降本增效之路——从信息密度出发
人工智能·深度学习·机器学习·自然语言处理·大模型·llm·大语言模型
数据智能老司机21 小时前
从零开始构建大型语言模型——实现注意力机制
深度学习·神经网络·llm
Seal软件1 天前
GPUStack 0.2:开箱即用的分布式推理、CPU推理和调度策略
大模型·llm·aigc·gpu·genai·gpu集群
阿里云大数据AI技术1 天前
对接开源大模型应用开发平台最佳实践
人工智能·阿里云·llm·opensearch
skywalk81631 天前
使用PaddleNLP调用大模型ChatGLM3-6b进行信息抽取
人工智能·llm·chatglm
Hoper.J1 天前
使用 HFD 加快 Hugging Face 模型和数据集的下载
llm·aigc·hugging face·hfd