Claude3真的超越GPT4了吗?

一文探究Claude3真实能力

Claude3就在昨天悄无声息的上线了,OpenAI的好兄弟Anthropic公司仅仅在推特上发了一条消息来宣布这件事情。

Anthropic这次一下就发了三个模型:Opus、Sonnet、Haiku。说实话这名字感觉取得不咋地,主要是看不懂,要是不按顺序一起出现都不知道哪个是最牛逼的。

不过这些都不重要,直接上数据。

看看最强的Opus,仅从图上来看确实暴打GPT4。特别是有个指标很显眼,MGSM这个有关数学推理的数据集,0-shot的Claude3吊锤了8-shot的GPT4。

0-shot的意思是没给任何Prompt,直接上来就开始做题。而8-shot是先给了8个正确的示例再让你做题。由此引出我感觉Claude3第一项很强的点

极强的推理能力

所谓推理能力,最直观解释就是数学题,也就是和逻辑强相关的一些任务。相对于其他一些语言知识类的数据集,这项任务其实最难提升,这也很好理解,因为我们日常学习中数学逻辑相关的确实是最难学的。

直接上物理题!

只能说,完全正确...

补齐多模态

Claude3这次发布还有一项重要能力,就是补齐了之前没有的多模态能力。我们在日常用GPT4的时候经常需要用到上传图片进行一些任务处理,这次Claude3也终于加上了。

不过,效果好像..不太惊艳

这个图GPT4的回答有点长就不贴图了,GPT4给出了一个基本可用的代码,而Claude3直接摆烂了。

不过根据网上其他人的一些测试基本还是可用的,那总结下来多模态这一部分只能说确实还没有超越GPT4.

长文本处理

最后Claude3还有一个亮眼的点是新增了长文本的处理,也就是说哪怕你扔一本书进去,他也能够较好的概括总结和你对话

就是这响应时间实在太长了,等得花儿都谢了...

总结

这次Claude3确实展示了他的实力,在推理能力和长文本处理上确实还是比较亮眼。不过和GPT4还是伯仲之间,没有那种让人惊呼换代的差距。不过要知道GPT4已经是一年前发布的了,谁知道OpenAI还有多少神奇魔法呢,拭目以待吧。

并且Claude3国内真的很难正常使用啊!博主已经被封了n个号,后面一定还要写篇文章记录下怎么用Claude3。

PS:欢迎关注博主个人网站,点击这里阅读原文 体验更佳,包含AI应用的前沿内容。

相关推荐
是店小二呀2 小时前
昇腾 NPU 环境下 GPT-2 模型本地部署全指南(含踩坑排错)
gpt·npu
小桥流水---人工智能1 天前
我的中英翻译统一GPT指令模板(专业三阶段翻译流程备忘)
gpt
百***24371 天前
小米MiMo-V2-Flash深度解析:国产开源大模型的轻量化落地革命
java·人工智能·gpt
前端程序猿之路2 天前
AI大模型应用之-RAG 全流程
人工智能·python·gpt·语言模型·aigc·mybatis·ai编程
Lian_Ge_Blog2 天前
GPT 系列学习总结(1-3)
gpt
百***78753 天前
Step-Audio-2 轻量化接入全流程详解
android·java·gpt·php·llama
百***07454 天前
GPT-Image-1.5 极速接入全流程及关键要点
人工智能·gpt·计算机视觉
百***07454 天前
gpt-image-1.5国内API稳定接入全方案(含多模态实操)
开发语言·gpt·php
百***78754 天前
gpt-image-1.5极速接入指南:3步上手+图像核心能力解析+避坑手册
android·java·gpt
徐同保4 天前
n8n+GPT 5.2+Simple Memory + SerpAPI实现向openai提问,机器人可以结合之前提问过的问题回答,支持联网搜索
gpt