Claude 3 Opus 效果是否真的可以超过GPT-4?

实测,不仅是超过,而且我个人感觉这个差距甚至大于GPT3.5到GPT4的距离.

claude3在长篇理学论文的解析能力是非常显著的,可以扩展补完作者省略的大量运用高等数学,复变函数以及更多数理方法的计算过程,并且将中间过程补完的非常完美.不会漏符号,错符号,偏差数值之类的问题.工科许多运动学,物理学和其他机理内容都能快速扩展。

相信大的上下文可以协助复杂的代码模块去调整功能,或者去调整架构,这些都是GPT4有限的token或者昂贵的GPT4-128k所不能及的。

大家可以在AskManyAI去做claude3和gpt4的对比测试,最方便的全球大模型评测站点,支持大模型对比测试,最方便没有之一:

https://askmanyai.cn

以下部分我觉得基本正确.

opus结果opus结果原文相关内容

再补充一些跟opus的讨论结果吧,以下是过载,也就是上传了远比token大的文件中让它讨论的内容.里面的信息太多,我也很难鉴别对比原文是否足够准确.但是这个推理过程和结果还是正确的.问题是[作者如何完成Cauchy问题的基本解的求解]

opus单次输出结果

一句话总结,opus 碉堡了。

大家可以在AskManyAI去做claude3和gpt4的对比测试,最方便的全球大模型评测站点,支持大模型对比测试,最方便没有之一:

https://askmanyai.cn

相关推荐
小橙讲编程13 分钟前
给 AI 编程助手装上“谷歌工程纪律“:30+K Star 项目 Agent Skills 深度技术解读
ai编程
記億揺晃着的那天1 小时前
Claude Code 系统提示词里的安全底线:OWASP Top 10
安全·ai·ai编程·vibe coding·claude code
我认不到你1 小时前
拒绝token焦虑 cpa(CLI Proxy API)反代 chatgpt(Codex) 保姆级全图文教程
人工智能·ai·chatgpt
搬砖的小码农_Sky1 小时前
AI Agent:OpenClaw的算法架构
人工智能·算法·ai·架构·人机交互·agi
Orange_sparkle2 小时前
rerank模型原理
ai
豆豆2 小时前
网站建设行业进入“AI辅助”时代:效率提升但别忽略基础
ai·cms·建站系统·建站平台·自助建站·内容管理系统·网站管理系统
Irissgwe3 小时前
LangChain之核心组件(文档加载器Document loaders)
人工智能·ai·langchain·llm·rag·langgraph·文档加载器
Hello_Embed3 小时前
串口硬件结构与三种编程方式
笔记·stm32·学习·ai编程
Bruce_Liuxiaowei3 小时前
AI投毒产业链曝光:安全工程师怎么看、怎么防
人工智能·安全·ai·投毒
captain_AIouo4 小时前
数据驱动运营,Captain AI打造OZON全链路数据闭环
大数据·人工智能·经验分享·aigc