实测哪些大模型和claude code比较搭配

原生的claude确实比较好用,这点毋庸置疑。但是问题是,第一、claude禁止中国区用户使用,封的特别厉害。第二、费用非常高。那么有哪些大模型可以和claude code搭配使用呢?

在开始前,也看了很多文章,国内多个大模型都说自己达到了接近claude sonnet的能力,是真的这样么?我们今天拿事实说话------拿编程任务测试下,看看效果。

1. 怎么测?

  1. claude code + claude-code-router + open router配置各家ai
  2. 编程语言:go语言
  3. 需求提示词:
markdown 复制代码
使用go语言开发,实现一个分布式场景下的singlefight(go语言的singlefight只在单独的进程内有效),搭配redis实现,要求:
1. 实现一个完成功能包,使用时,直接导入即可使用
2. 需要包含完整集成测试,redis连接本地就行
3. 使用时支持singlefight使用的key,超时时间、缓存时间等信息

2. 测试结果

大模型 完成情况 token花费
anthropic/claude-sonnet-4 一次性完成,代码无任何问题,非常全面,非常快大概8分钟就写好了 1$左右
google/gemini-2.5-pro 完成后,存在包导入问题,提示后成功修复,也比较快和claude时间差不多 1$左右,之所以消耗这么多,是因为它重复的提示连接不上redis,不断的重复分析,导致多消耗了很多。后面启动redis服务后就好了
qwen/qwen3-coder 完成后,测试代码存在超时问题,提示后成功修复 0.3$左右
moonshotai/kimi-k2-0905 执行的过程前期看起非常顺利,后期部分始终有代码问题不能解决,自行尝试了很多轮,耗费非常长时间,最终也没能完成 1$左右
z-ai/glm-4.5 始终未能完成,耗费时间超过预期后,失去耐心,只好终止任务,未能完成 0.3$
x-ai/grok-code-fast-1 经过长时间测试,始终未能完成,后面被迫终止任务;之所以想测试它是因为,看到在openrouter上它的使用在编程方面排名第一 1$ 大量尝试导致耗费较高

经过测试,排名第一(claude-sonnet-4)和第二(google/gemini-2.5-pro)都没有疑问,让我诧异的是qwen/qwen3-coder,居然是国内大模型中表现最好的。一开始,看了很多文章都说kimi-k2-0905表现最好,它本身也支持claude code使用,但实测下来不理想。

另外,经过测试发现,有些大模型虽然价格便宜,但是在使用过程中,如果多次、始终不能解决问题。那么它的花销其实不比cluade-sonnet-4好,claude-sonnet-4好处就是省心、省时。

为了证明,我是真的实测过的,现把生成的代码目录结构贴在这里

shell 复制代码
├── claude-4
│   ├── Makefile
│   ├── README.md
│   ├── benchmark_test.go
│   ├── demo
│   │   └── performance_demo.go
│   ├── distributed_lock.go
│   ├── dump.rdb
│   ├── example
│   │   └── main.go
│   ├── go.mod
│   ├── go.sum
│   ├── integration_test.go
│   ├── singleflight.go
│   └── singleflight_test.go
├── dump.rdb
├── gemini-2.5-pro
│   ├── distributedsingleflight
│   │   ├── distributedsingleflight.go
│   │   └── distributedsingleflight_test.go
│   ├── example.go
│   ├── go.mod
│   └── go.sum
├── glm-4.5
│   ├── go.mod
│   ├── go.sum
│   └── singlefight
│       ├── README.md
│       ├── example
│       │   └── main.go
│       ├── integration_test.go
│       ├── options.go
│       └── singlefight.go
├── grok-code-fast-1
│   ├── distributed-singleflight
│   │   ├── cache.go
│   │   ├── config.go
│   │   ├── distributed_singleflight.go
│   │   ├── errors.go
│   │   ├── examples
│   │   ├── internal
│   │   ├── lock.go
│   │   └── tests
│   └── go.mod
├── kimi-k2
│   ├── distributed-singleflight
│   │   ├── README.md
│   │   ├── example
│   │   │   └── main.go
│   │   ├── go.mod
│   │   └── pkg
│   │       └── singleflight
│   │           ├── redis.go
│   │           ├── singleflight.go
│   │           ├── singleflight_clean.go
│   │           ├── singleflight_new.go
│   │           ├── singleflight_old.go
│   │           └── singleflight_test.go
│   ├── go.mod
│   ├── go.sum
│   └── pkg
│       └── singleflight
│           └── singleflight.go
└── qwen3-coder
    ├── Makefile
    ├── README.md
    ├── dump.rdb
    ├── example
    │   └── main.go
    ├── go.mod
    ├── go.sum
    ├── package.json
    ├── redis
    └── singleflight
        ├── singleflight.go
        └── singleflight_test.go

好了,上面的结果都是本人实测,希望对您了解各大ai能力有各认识,节省您选择成本。

相关推荐
Skyrin7 小时前
Android i18n MCP: 基于 Git Diff 的智能增量翻译方案,让多语言适配效率提升 10 倍!
ai编程·mcp
Sam_Deep_Thinking8 小时前
在Windows 11上配置Cursor IDE进行Java开发
ai编程·cursor
飞哥数智坊21 小时前
AI 编程太混乱?我的3个实践,防止代码失控
人工智能·ai编程
ITZHIHONH1 天前
FastGPT源码解析 Agent 智能体插件实现代码分析
ai·开源·ai编程
coder_pig1 天前
👦抠腚男孩的AI学习之旅 | 7、LangChain (三) - 实战:知识库问答机器人 (RAG )
langchain·aigc·ai编程
动能小子ohhh1 天前
AI智能体(Agent)大模型入门【2】--基于llamaindx部署本地的聊天模型。
人工智能·python·aigc·ai编程
CoderJia程序员甲1 天前
GitHub 热榜项目 - 日榜(2025-09-11)
ai·开源·github·ai编程·github热榜
该用户已不存在1 天前
腾讯放大招,Claude Code 国产平替发布
人工智能·ai编程
程序员老刘1 天前
CTO紧急叫停AI编程!不是技术倒退,而是...
flutter·ai编程