Claude 3 全新升级:多模态+超长上下文,全球最强大模型一夜易主 GPT-4 时代终结!

Anthropic发布最新动态:崭新Claude 3正式登场!

作为OpenAI的主要竞争对手,该模型家族最顶级版本,Claude 3 Opus,被誉为"逼近人类理解力"的代表------在推理、数学、编码、多语言理解和视觉等方面,彻底超越了所有大型模型,包括GPT-4,在行业中重新树立了新的标杆。

Sonnet作为次强版本目前可免费体验,而Opus作为最强版本仅供Claude Pro用户使用,但大型模型竞技场可以免费试用。结果,在网友间已经掀起了一股热潮。此外,Opus和Sonnet还提供API访问权限,开发者可立即开始使用。

最新最强大模型发布

在这次Claude 3发布的模型中,共分三种:Haiku、Sonnet和Opus,其成本和性能逐渐升级。

在性能方面,Claude 3全系列在各方面均有全面提升。特别是Opus在MMLU、GPQA和GSM8K等评估基准上均领先于其他所有模型:

还有在视觉能力上,它能可以处理各种视觉格式,包括照片、图表、图形和技术图表。

此外,在拒绝回答人类问题方面,Claude 3也有了显著进步,其拒绝回答的可能性大幅降低。

在上下文和记忆能力方面,圈内人使用"大海捞针"指标来评估大型模型从大量数据中准确检索信息的能力。而 Claude 3 Opus 展现出接近完美的召回率,超过99%的准确性。

在生物知识和网络相关知识等领域取得进展,但出于责任考虑,仍然处于AI安全级别2(ASL-2)。

其次,在响应时间方面,Claude 3已大幅缩短,实现近乎实时响应。

根据官方介绍,即将发布的小杯Haiku可以在三秒内阅读并理解带有图表的长度约 10k token 的 arXiv 论文。

而中杯Sonnet在智能水平上更上一层楼,速度比Claude 2和Claude 2.1快两倍,特别擅长知识检索和自动化销售等需要快速响应的任务。

大杯Opus拥有最高的智能水平,速度却未减,与Claude 2和Claude 2.1相当。

官方对三款型号的模型也有明确定位:

  • 大杯Opus:更智能,适用于复杂任务自动化、研发和制定策略;

  • 中杯Sonnet:更实惠,更适用于规模化,适用于数据处理、RAG等,在中等复杂度工作流中节省时间;

  • 小杯Haiku:更快速、更实惠,适用于实时用户互动以及在简单工作流程中节省成本;

至于价格方面,最便宜的小杯定价为0.25美元/1M tokens输入,最贵的大杯定价为75美元/1M tokens输入。

传送门:kua戳下方链接体验吧~

参考链接:

1\][https://claude.ai/](https://claude.ai/ "https://claude.ai/") \[2\][https://www.anthropic.com/news/claude-3-family](https://www.anthropic.com/news/claude-3-family "https://www.anthropic.com/news/claude-3-family") 👇关注我,学习更多关于 AI 大模型全栈知识👇 ![](https://file.jishuzhan.net/article/1764958500095528961/bb051147bc8cffa2a800a9e64bfefd0c.webp)

相关推荐
郄堃Deep Traffic6 分钟前
机器学习+城市规划第十四期:利用半参数地理加权回归来实现区域带宽不同的规划任务
人工智能·机器学习·回归·城市规划
GIS小天1 小时前
AI+预测3D新模型百十个定位预测+胆码预测+去和尾2025年6月7日第101弹
人工智能·算法·机器学习·彩票
阿部多瑞 ABU1 小时前
主流大语言模型安全性测试(三):阿拉伯语越狱提示词下的表现与分析
人工智能·安全·ai·语言模型·安全性测试
cnbestec1 小时前
Xela矩阵三轴触觉传感器的工作原理解析与应用场景
人工智能·线性代数·触觉传感器
不爱写代码的玉子1 小时前
HALCON透视矩阵
人工智能·深度学习·线性代数·算法·计算机视觉·矩阵·c#
sbc-study1 小时前
PCDF (Progressive Continuous Discrimination Filter)模块构建
人工智能·深度学习·计算机视觉
EasonZzzzzzz2 小时前
计算机视觉——相机标定
人工智能·数码相机·计算机视觉
猿小猴子2 小时前
主流 AI IDE 之一的 Cursor 介绍
ide·人工智能·cursor
要努力啊啊啊2 小时前
Reranker + BM25 + FAISS 构建高效的多阶段知识库检索系统一
人工智能·语言模型·自然语言处理·faiss
EasyDSS2 小时前
国标GB28181设备管理软件EasyGBS远程视频监控方案助力高效安全运营
网络·人工智能