实测哪些大模型和claude code比较搭配

原生的claude确实比较好用,这点毋庸置疑。但是问题是,第一、claude禁止中国区用户使用,封的特别厉害。第二、费用非常高。那么有哪些大模型可以和claude code搭配使用呢?

在开始前,也看了很多文章,国内多个大模型都说自己达到了接近claude sonnet的能力,是真的这样么?我们今天拿事实说话------拿编程任务测试下,看看效果。

1. 怎么测?

  1. claude code + claude-code-router + open router配置各家ai
  2. 编程语言:go语言
  3. 需求提示词:
markdown 复制代码
使用go语言开发,实现一个分布式场景下的singlefight(go语言的singlefight只在单独的进程内有效),搭配redis实现,要求:
1. 实现一个完成功能包,使用时,直接导入即可使用
2. 需要包含完整集成测试,redis连接本地就行
3. 使用时支持singlefight使用的key,超时时间、缓存时间等信息

2. 测试结果

大模型 完成情况 token花费
anthropic/claude-sonnet-4 一次性完成,代码无任何问题,非常全面,非常快大概8分钟就写好了 1$左右
google/gemini-2.5-pro 完成后,存在包导入问题,提示后成功修复,也比较快和claude时间差不多 1$左右,之所以消耗这么多,是因为它重复的提示连接不上redis,不断的重复分析,导致多消耗了很多。后面启动redis服务后就好了
qwen/qwen3-coder 完成后,测试代码存在超时问题,提示后成功修复 0.3$左右
moonshotai/kimi-k2-0905 执行的过程前期看起非常顺利,后期部分始终有代码问题不能解决,自行尝试了很多轮,耗费非常长时间,最终也没能完成 1$左右
z-ai/glm-4.5 始终未能完成,耗费时间超过预期后,失去耐心,只好终止任务,未能完成 0.3$
x-ai/grok-code-fast-1 经过长时间测试,始终未能完成,后面被迫终止任务;之所以想测试它是因为,看到在openrouter上它的使用在编程方面排名第一 1$ 大量尝试导致耗费较高

经过测试,排名第一(claude-sonnet-4)和第二(google/gemini-2.5-pro)都没有疑问,让我诧异的是qwen/qwen3-coder,居然是国内大模型中表现最好的。一开始,看了很多文章都说kimi-k2-0905表现最好,它本身也支持claude code使用,但实测下来不理想。

另外,经过测试发现,有些大模型虽然价格便宜,但是在使用过程中,如果多次、始终不能解决问题。那么它的花销其实不比cluade-sonnet-4好,claude-sonnet-4好处就是省心、省时。

为了证明,我是真的实测过的,现把生成的代码目录结构贴在这里

shell 复制代码
├── claude-4
│   ├── Makefile
│   ├── README.md
│   ├── benchmark_test.go
│   ├── demo
│   │   └── performance_demo.go
│   ├── distributed_lock.go
│   ├── dump.rdb
│   ├── example
│   │   └── main.go
│   ├── go.mod
│   ├── go.sum
│   ├── integration_test.go
│   ├── singleflight.go
│   └── singleflight_test.go
├── dump.rdb
├── gemini-2.5-pro
│   ├── distributedsingleflight
│   │   ├── distributedsingleflight.go
│   │   └── distributedsingleflight_test.go
│   ├── example.go
│   ├── go.mod
│   └── go.sum
├── glm-4.5
│   ├── go.mod
│   ├── go.sum
│   └── singlefight
│       ├── README.md
│       ├── example
│       │   └── main.go
│       ├── integration_test.go
│       ├── options.go
│       └── singlefight.go
├── grok-code-fast-1
│   ├── distributed-singleflight
│   │   ├── cache.go
│   │   ├── config.go
│   │   ├── distributed_singleflight.go
│   │   ├── errors.go
│   │   ├── examples
│   │   ├── internal
│   │   ├── lock.go
│   │   └── tests
│   └── go.mod
├── kimi-k2
│   ├── distributed-singleflight
│   │   ├── README.md
│   │   ├── example
│   │   │   └── main.go
│   │   ├── go.mod
│   │   └── pkg
│   │       └── singleflight
│   │           ├── redis.go
│   │           ├── singleflight.go
│   │           ├── singleflight_clean.go
│   │           ├── singleflight_new.go
│   │           ├── singleflight_old.go
│   │           └── singleflight_test.go
│   ├── go.mod
│   ├── go.sum
│   └── pkg
│       └── singleflight
│           └── singleflight.go
└── qwen3-coder
    ├── Makefile
    ├── README.md
    ├── dump.rdb
    ├── example
    │   └── main.go
    ├── go.mod
    ├── go.sum
    ├── package.json
    ├── redis
    └── singleflight
        ├── singleflight.go
        └── singleflight_test.go

好了,上面的结果都是本人实测,希望对您了解各大ai能力有各认识,节省您选择成本。

相关推荐
yaocheng的ai分身3 小时前
【转载】Claude Code 是个猛兽——6个月硬核使用心得
claude
yaocheng的ai分身3 小时前
【转载】我测试了30多个社区Claude技能一周。这是真正有效的skills
claude
寒秋丶5 小时前
AutoGen多智能体协作、人机交互与终止条件
人工智能·python·microsoft·ai·人机交互·ai编程·ai写作
潘小安7 小时前
跟着 AI 学(三)- spec-kit +claude code 从入门到出门
前端·ai编程·claude
DO_Community11 小时前
AI 推理 GPU 选型指南:从 A100 到 L40S 再看 RTX 4000 Ada
人工智能·aigc·ai编程·ai推理
用户40993225021215 小时前
快速入门Vue模板里的JS表达式有啥不能碰?计算属性为啥比方法更能打?
前端·ai编程·trae
飞哥数智坊16 小时前
AI Coding 新手常见的3大误区
人工智能·ai编程
湘-枫叶情缘16 小时前
敏捷开发遇阻?AI编程或让传统开发逢春
ai编程·敏捷流程
伟贤AI之路1 天前
开源!纯 HTML 实现支持 0.75~2× 变速、iOS 熄屏防中断的英语点读站
人工智能·ai编程
苦瓜汤补钙1 天前
论文阅读——Segment Anything(Meta AI)——SAM
论文阅读·图像处理·人工智能·nlp·ai编程