Claude 3 Opus 效果是否真的可以超过GPT-4?

实测,不仅是超过,而且我个人感觉这个差距甚至大于GPT3.5到GPT4的距离.

claude3在长篇理学论文的解析能力是非常显著的,可以扩展补完作者省略的大量运用高等数学,复变函数以及更多数理方法的计算过程,并且将中间过程补完的非常完美.不会漏符号,错符号,偏差数值之类的问题.工科许多运动学,物理学和其他机理内容都能快速扩展。

相信大的上下文可以协助复杂的代码模块去调整功能,或者去调整架构,这些都是GPT4有限的token或者昂贵的GPT4-128k所不能及的。

大家可以在AskManyAI去做claude3和gpt4的对比测试,最方便的全球大模型评测站点,支持大模型对比测试,最方便没有之一:

https://askmanyai.cn

以下部分我觉得基本正确.

opus结果opus结果原文相关内容

再补充一些跟opus的讨论结果吧,以下是过载,也就是上传了远比token大的文件中让它讨论的内容.里面的信息太多,我也很难鉴别对比原文是否足够准确.但是这个推理过程和结果还是正确的.问题是[作者如何完成Cauchy问题的基本解的求解]

opus单次输出结果

一句话总结,opus 碉堡了。

大家可以在AskManyAI去做claude3和gpt4的对比测试,最方便的全球大模型评测站点,支持大模型对比测试,最方便没有之一:

https://askmanyai.cn

相关推荐
SHI-HANG17 分钟前
13 Midjourney从零到商用·实战篇:漫画设计一条龙
ai作画·aigc·midjourney
千寻简1 小时前
Cursor免费 GPT-4 IDE 工具的保姆级使用教程
java·运维·ide·ai
灵魂画师向阳2 小时前
AI绘画Stable Diffusion 自制素材工具: layerdiffusion插件—你的透明背景图片生成工具
ai作画·stable diffusion·ai绘画·抠图·ai绘画教程·透明背景·sd教程
NLP工程化2 小时前
Dify 中的讯飞星火平台工具源码分析
aigc·dify
Seal软件2 小时前
GPUStack 0.2:开箱即用的分布式推理、CPU推理和调度策略
大模型·llm·aigc·gpu·genai·gpu集群
GPUStack2 小时前
GPUStack 0.2:开箱即用的分布式推理、CPU推理和调度策略
ai·大模型·aigc·gpu·genai·gpu集群
Hoper.J3 小时前
使用 HFD 加快 Hugging Face 模型和数据集的下载
llm·aigc·hugging face·hfd
virtaitech13 小时前
OrionX GPU算力池助力AI OCR场景应用
人工智能·ai·ocr·gpu算力·ai算力资源池化
雅菲奥朗17 小时前
FinOps三人行:共话FinOps云成本管理与AI的未来在线分享(文字+视频)
人工智能·aigc·finops·云财务管理·云成本管理
冷眼看人间恩怨18 小时前
【话题讨论】AI时代程序员核心力:技术深耕,跨界学习,软硬兼备
人工智能·学习·aigc