DeepSeek缝合Claude,比单用R1/o1效果都好!GitHub揽星3k

DeepSeek 代替 Claude 思考,缝合怪玩法火了。

原因无它:比单独使用 DeepSeek R1、Claude Sonnet 3.5、OpenAI o1 模型的效果更好

来看一个测评结果:

代码编辑基准 Polyglot Benchmark 上,缝合模型效果小超 o1-high 和 R1 一头。

在这个测试中,R1 扮演架构师,描述如何解决代码问题。

Claude 扮演程序员,按要求生成特定的代码编辑指令,以便把改动应用到源文件中。

除此之外,实验过程中还得出还有几个有意思的结论:

  • o1 与 Claude Sonnet 搭配效果并不如单独使用 o1。

  • 使用 R1 或 o1 当架构师,Claude 之外的其他模型当程序员,效果都不如单独使用 R1 或 o1。

  • o1-preview 和 o1-mini 当架构师,使用很多不同的模型当程序员都能提高组合的成绩。

  • 使用 R1 的推理过程 token 效果不如使用 R1 的最终输出 token。

这样看来,R1 和 Claude Sonnet 还真是一对绝配啊~

DeepClaude 应用本身 100% 免费且开源,在 GitHub 上已揽获 3k 星星(当然 API 要用自己的)。

网友测试后总结到:Claude 擅长撰写清晰、结构良好的文本和代码,因此它能将 DeepSeek-R1 的想法转化为精炼的回复。

DeepClaude 作者之一对此有感而发:

AI 智能体和智能体应用正在展示出一种 "数字世界优先" 的范式转变,智能系统正在成为主动的合作者,而不仅仅是被动的工具。

DeepSeek 和 Claude 的混血儿

具体来说,DeepClaude 是一个 LLM 推理 API,通过 Rust 编写。

它提供了一个统一的接口,将 DeepSeek R1 的 CoT 逻辑推理能力和 Claude 的回复在单一流中无缝衔接

开发者可以通过这个 API 同时调用两种模型的功能,还能完全掌控自己的 API 密钥和数据。

打造它的团队名为 Asterisk,团队成员具有安全研究 & CTF(Capture The Flag)背景,致力于利用 AI 让检查代码安全这事儿变得更加高效。

团队认为,DeepSeek R1 的 CoT 深度推理甚至达到了 LLM 具有反省认知(metacognition)的程度,它能够自我纠正、思考不常见 / 极端 / 特殊的情况,并在自然语言中进行类似蒙特卡洛树搜索(MCTS)的推理。

不过 R1 在代码生成、创造力和对话技巧方面有所欠缺,Claude 3.5 Sonnet 在这些方面表现出色,刚好可以作补充。

何不将两者结合起来?取两者之长,打造出 DeepClaude~

对话中,Claude 回应之前,系统会显示 "" 这样的预填充文本。

DeepClaude 结合了这两种模型,具有以下特性:

托管 API 完全免费,允许用户使用自己的密钥,并将 DeepSeek 和 Claude 的流式 API 整合在一起,提供计算组合使用量和价格等便利功能。

代码是开源的,用户可以自由托管、修改和重新分发。团队表示它已经在 Asterisk 的生产环境中大规模使用,每天处理数百万 token,至今尚未出现故障,只要不滥用就行。

One More Thing

你以为两个模型缝合就是极限了吗?

No no no

还有网友开发出了三缝合玩法,将 DeepSeek-R1 和 Gemini 2.0 Flash 的思考结果组合起来,在让 Claude Sonnet 去回答问题。

在 GPQA 测试(谷歌搜不到的理化生博士级选择题)中也取得了好成绩。

Github 地址:github.com/getasterisk...

参考链接:

1\][aider.chat/2025/01/24/...](https://link.juejin.cn?target=https%3A%2F%2Faider.chat%2F2025%2F01%2F24%2Fr1-sonnet.html "https://aider.chat/2025/01/24/r1-sonnet.html") \[2\][x.com/deepclaude_...](https://link.juejin.cn?target=https%3A%2F%2Fx.com%2Fdeepclaude_%2Fstatus%2F1886911416478642279 "https://x.com/deepclaude_/status/1886911416478642279") \[3\][x.com/omercelik/s...](https://link.juejin.cn?target=https%3A%2F%2Fx.com%2Fomercelik%2Fstatus%2F1883510797193937278 "https://x.com/omercelik/status/1883510797193937278") \[4\][x.com/mufeedvh/st...](https://link.juejin.cn?target=https%3A%2F%2Fx.com%2Fmufeedvh%2Fstatus%2F1883620781583901011 "https://x.com/mufeedvh/status/1883620781583901011") --- **完** ---

相关推荐
AIGC安琪8 分钟前
Transformer中的编码器和解码器是什么?
人工智能·深度学习·ai·语言模型·大模型·transformer·ai大模型
算家计算20 分钟前
3秒搞定产品换装换背景!【ComfyUI-万物迁移工作流】本地部署教程:基于FLUX.1 Kontext上下文感知图像编辑
人工智能
山烛29 分钟前
OpenCV 图像处理基础操作指南(二)
人工智能·python·opencv·计算机视觉
聚客AI40 分钟前
🧩万亿级Token训练!解密大模型预训练算力黑洞与RLHF对齐革命
人工智能·llm·强化学习
爱疯生活1 小时前
车e估牵头正式启动乘用车金融价值评估师编制
大数据·人工智能·金融
JXL18601 小时前
机器学习概念(面试题库)
人工智能·机器学习
星期天要睡觉1 小时前
机器学习深度学习 所需数据的清洗实战案例 (结构清晰、万字解析、完整代码)包括机器学习方法预测缺失值的实践
人工智能·深度学习·机器学习·数据挖掘
岁月静好20251 小时前
BadNets: Identifying Vulnerabilities in the Machine Learning Model Supply Chain
人工智能·机器学习
说私域2 小时前
基于开源 AI 大模型 AI 智能名片 S2B2C 商城小程序视角下的企业组织能力建设与破圈升级
人工智能·小程序
2401_858869802 小时前
K近邻算法(knn)
人工智能