Claude 3 Opus 效果是否真的可以超过GPT-4?

实测,不仅是超过,而且我个人感觉这个差距甚至大于GPT3.5到GPT4的距离.

claude3在长篇理学论文的解析能力是非常显著的,可以扩展补完作者省略的大量运用高等数学,复变函数以及更多数理方法的计算过程,并且将中间过程补完的非常完美.不会漏符号,错符号,偏差数值之类的问题.工科许多运动学,物理学和其他机理内容都能快速扩展。

相信大的上下文可以协助复杂的代码模块去调整功能,或者去调整架构,这些都是GPT4有限的token或者昂贵的GPT4-128k所不能及的。

大家可以在AskManyAI去做claude3和gpt4的对比测试,最方便的全球大模型评测站点,支持大模型对比测试,最方便没有之一:

https://askmanyai.cn

以下部分我觉得基本正确.

opus结果opus结果原文相关内容

再补充一些跟opus的讨论结果吧,以下是过载,也就是上传了远比token大的文件中让它讨论的内容.里面的信息太多,我也很难鉴别对比原文是否足够准确.但是这个推理过程和结果还是正确的.问题是[作者如何完成Cauchy问题的基本解的求解]

opus单次输出结果

一句话总结,opus 碉堡了。

大家可以在AskManyAI去做claude3和gpt4的对比测试,最方便的全球大模型评测站点,支持大模型对比测试,最方便没有之一:

https://askmanyai.cn

相关推荐
reddingtons2 小时前
【游戏宣发】PS “生成式扩展”流,30秒无损适配全渠道KV
游戏·设计模式·新媒体运营·prompt·aigc·教育电商·游戏美术
风送雨3 小时前
FastMCP 2.0 服务端开发教学文档(下)
服务器·前端·网络·人工智能·python·ai
效率客栈老秦3 小时前
Python Trae提示词开发实战(8):数据采集与清洗一体化方案让效率提升10倍
人工智能·python·ai·提示词·trae
小和尚同志3 小时前
虽然 V0 很强大,但是ScreenshotToCode 依旧有市场
人工智能·aigc
哥布林学者4 小时前
吴恩达深度学习课程五:自然语言处理 第一周:循环神经网络 (四)RNN 中的梯度现象
深度学习·ai
yuhaiqun19894 小时前
学服务器训练AI模型:5步路径助力高效入门
运维·服务器·人工智能·笔记·机器学习·ai
后端小肥肠4 小时前
18条作品狂揽390万赞?我用Coze破解了“情绪放大镜”的流量密码
人工智能·aigc·coze
gentle coder5 小时前
一文入门ReAct Agent,附从零构建 ReAct Agent
ai·agent·思维链·智能体·react agent
Nicander5 小时前
Netflix工程师的警告:AI正在编写我们看不懂的代码,我们该如何应对?
ai编程
小糖豆巴拉巴拉5 小时前
AI应用(5)- RAG知识库理解
ai