Claude 3 Opus 效果是否真的可以超过GPT-4?

实测,不仅是超过,而且我个人感觉这个差距甚至大于GPT3.5到GPT4的距离.

claude3在长篇理学论文的解析能力是非常显著的,可以扩展补完作者省略的大量运用高等数学,复变函数以及更多数理方法的计算过程,并且将中间过程补完的非常完美.不会漏符号,错符号,偏差数值之类的问题.工科许多运动学,物理学和其他机理内容都能快速扩展。

相信大的上下文可以协助复杂的代码模块去调整功能,或者去调整架构,这些都是GPT4有限的token或者昂贵的GPT4-128k所不能及的。

大家可以在AskManyAI去做claude3和gpt4的对比测试,最方便的全球大模型评测站点,支持大模型对比测试,最方便没有之一:

https://askmanyai.cn

以下部分我觉得基本正确.

opus结果opus结果原文相关内容

再补充一些跟opus的讨论结果吧,以下是过载,也就是上传了远比token大的文件中让它讨论的内容.里面的信息太多,我也很难鉴别对比原文是否足够准确.但是这个推理过程和结果还是正确的.问题是[作者如何完成Cauchy问题的基本解的求解]

opus单次输出结果

一句话总结,opus 碉堡了。

大家可以在AskManyAI去做claude3和gpt4的对比测试,最方便的全球大模型评测站点,支持大模型对比测试,最方便没有之一:

https://askmanyai.cn

相关推荐
攻城狮7号1 小时前
Kimi 发布并开源 K2.5 模型:开始在逻辑和干活上卷你了
人工智能·ai编程·视觉理解·kimi code·kimi k2.5·agent 集群
feasibility.1 小时前
混元3D-dit-v2-mv-turbo生成3D模型初体验(ComfyUI)
人工智能·3d·aigc·三维建模·comfyui
莱茶荼菜2 小时前
yolo26 阅读笔记
人工智能·笔记·深度学习·ai·yolo26
PaperRed ai写作降重助手3 小时前
AI 论文写作工具排名(实测不踩坑)
人工智能·aigc·ai写作·论文写作·智能降重·辅助写作·降重复率
~kiss~4 小时前
什么是大模型的词元嵌入权重-Token Embedding Weights
ai
松树戈5 小时前
滥用AI生图引起的JavaScript heap out of memory排查记录
vue.js·ai编程
哥布林学者6 小时前
吴恩达深度学习课程五:自然语言处理 第三周:序列模型与注意力机制(四)语音识别和触发字检测
深度学习·ai
阿杰学AI6 小时前
AI核心知识80——大语言模型之Slow Thinking和Deep Reasoning(简洁且通俗易懂版)
人工智能·ai·语言模型·自然语言处理·aigc·慢思考·深度推理
SeatuneWrite6 小时前
**AI漫剧配音2025推荐,专业适配与情感表达双提升方案*
ai
测试_AI_一辰6 小时前
项目实践笔记13:多用户事实碎片 Agent 的接口测试与约束设计
开发语言·人工智能·ai编程