Claude3真的超越GPT4了吗?

一文探究Claude3真实能力

Claude3就在昨天悄无声息的上线了,OpenAI的好兄弟Anthropic公司仅仅在推特上发了一条消息来宣布这件事情。

Anthropic这次一下就发了三个模型:Opus、Sonnet、Haiku。说实话这名字感觉取得不咋地,主要是看不懂,要是不按顺序一起出现都不知道哪个是最牛逼的。

不过这些都不重要,直接上数据。

看看最强的Opus,仅从图上来看确实暴打GPT4。特别是有个指标很显眼,MGSM这个有关数学推理的数据集,0-shot的Claude3吊锤了8-shot的GPT4。

0-shot的意思是没给任何Prompt,直接上来就开始做题。而8-shot是先给了8个正确的示例再让你做题。由此引出我感觉Claude3第一项很强的点

极强的推理能力

所谓推理能力,最直观解释就是数学题,也就是和逻辑强相关的一些任务。相对于其他一些语言知识类的数据集,这项任务其实最难提升,这也很好理解,因为我们日常学习中数学逻辑相关的确实是最难学的。

直接上物理题!

只能说,完全正确...

补齐多模态

Claude3这次发布还有一项重要能力,就是补齐了之前没有的多模态能力。我们在日常用GPT4的时候经常需要用到上传图片进行一些任务处理,这次Claude3也终于加上了。

不过,效果好像..不太惊艳

这个图GPT4的回答有点长就不贴图了,GPT4给出了一个基本可用的代码,而Claude3直接摆烂了。

不过根据网上其他人的一些测试基本还是可用的,那总结下来多模态这一部分只能说确实还没有超越GPT4.

长文本处理

最后Claude3还有一个亮眼的点是新增了长文本的处理,也就是说哪怕你扔一本书进去,他也能够较好的概括总结和你对话

就是这响应时间实在太长了,等得花儿都谢了...

总结

这次Claude3确实展示了他的实力,在推理能力和长文本处理上确实还是比较亮眼。不过和GPT4还是伯仲之间,没有那种让人惊呼换代的差距。不过要知道GPT4已经是一年前发布的了,谁知道OpenAI还有多少神奇魔法呢,拭目以待吧。

并且Claude3国内真的很难正常使用啊!博主已经被封了n个号,后面一定还要写篇文章记录下怎么用Claude3。

PS:欢迎关注博主个人网站,点击这里阅读原文 体验更佳,包含AI应用的前沿内容。

相关推荐
edisao5 小时前
[特殊字符] 从助手到引擎:基于 GPT 的战略协作系统演示
大数据·人工智能·gpt
陈敬雷-充电了么-CEO兼CTO14 小时前
BLIP-2革新多模态预训练:QFormer桥接视觉语言,零样本任务性能飙升10.7%!
人工智能·gpt·机器学习·机器人·多模态·blip·多模态大模型
安思派Anspire1 天前
GPT-OSS 深度解析:OpenAI 最新大语言模型(LLM)架构
gpt·语言模型·架构
AIGC小火龙果3 天前
OpenAI的开源王牌:gpt-oss上手指南与深度解析
人工智能·经验分享·gpt·搜索引擎·aigc·ai编程
*星星之火*3 天前
【GPT入门】第66 课 llamaIndex调用远程llm模型与embedding模型的方法
gpt·embedding
golang学习记3 天前
Claude Code 平替:OpenAI发布 Codex CLI ,GPT-5 国内直接使用
gpt
z千鑫3 天前
【OpenAI】性价比极高的轻量级多模态模型GPT-4.1-mini介绍 + API KEY的使用教程!
人工智能·gpt·ai·语言模型·chatgpt
闲看云起3 天前
从 GPT 到 LLaMA:解密 LLM 的核心架构——Decoder-Only 模型
gpt·架构·llama
北京地铁1号线3 天前
GPT(Generative Pre-trained Transformer)模型架构与损失函数介绍
gpt·深度学习·transformer
*星星之火*4 天前
【GPT入门】第65课 vllm指定其他卡运行的方法,解决单卡CUDA不足的问题
gpt