【笔记】用cursor手搓cursor(三)简单尝试claude code

最近写着写着发现小模型怎么都不是很好用。

感觉还是技术不到家。openclaw和nanoclaw等开源的也就那样了,于是先把目光投向闭源的claude code。

首先是下载问题,要么你就好好做区域封锁,整个官网 install.sh 会显示区域封锁着呢。然后回头在github上就能暴露下载地址 claude-code-issue-13888: https://storage.googleapis.com/claude-code-dist-86c565f3-f756-42ad-8dfa-d59b1c096819/claude-code-releases/stable

这个就是stable的版本信息,latest是最新版本信息,有了之后继续根据这个 https://storage.googleapis.com/claude-code-dist-86c565f3-f756-42ad-8dfa-d59b1c096819/claude-code-releases 进行后续拼接 /<version>/manifest.json 就可以拿到不同系统和cpu arch的文件列表,然后 /<version>/<os>-<arch>/<claude filename> 就能下载了。

好了,有了闭源的龙虾binary,先玩起来:

bash 复制代码
export OLLAMA_CONTEXT_LENGTH=65536
ollama serve

export ANTHROPIC_BASE_URL=http://localhost:11434
export ANTHROPIC_AUTH_TOKEN=ollama
claude --model qwen3.5:9b

就可以本地跑了,关了telemetry以后,用tcpdump监测下,还是蛮干净的。vim这个binary随便翻一翻,有rust有bun有 ## 的prompt也就大概知道它是如何编译出来的了。网上关于claude code的逆向工程有很多文档了,就不赘述,大家自己看好了。剩下的就是拖到IDA里和文档一起学习了。

claude code的memory和context管理写得相当娴熟,比我的toy好得多,但是在4GB VM里经常OOM。所以还是自己写能控制住内存占用。它确实能让35B模型的执行和推理能力提升不少,但是对于9B模型还是比较难的。所以mac mini要是想自己养龙虾,建议64GB内存运行35B;当然,如果你不怕慢,网上诸如 flash-moe 这样的项目,可以让48GB mac laptop pro 运行 qwen3.5 397B-A17B,真正的cloud级别大模型加持。

harness模式将核心完全托管给LLM,这个模式显然不是我想要的最终形态。但是它能给出一些灵感激发。在进行下一步之前,让我继续好好思考下belief系统,并且继续探索下如果能让35B和claude code配合,能把coding plan规划得更详细------从让claude模型直接写出所有代码变成让qwen 35B模型分解成各个小函数然后拼接出可运行的代码。

相关推荐
了一梨3 小时前
[T113] 交叉编译 libmpv
linux·笔记·学习
sheeta19983 小时前
LeetCode 每日一题笔记 日期:2025.03.25 题目:3546.等和矩阵分割
笔记·leetcode·矩阵
unityのkiven3 小时前
Hello-Claw 第一章学习笔记
笔记·学习
爆更小哇3 小时前
接口测试课程笔记
笔记·测试工具
Binarydog_Lee3 小时前
TA笔记:Houdini基础1
笔记·houdini
星轨初途3 小时前
【C/C++底层修炼】拆解动态内存管理:四大动态内存函数、六大错误与柔性数组
c语言·开发语言·c++·经验分享·笔记·柔性数组
妄汐霜13 小时前
小白学习笔记(spring框架的aop和tx)
笔记·学习
sheeta199814 小时前
LeetCode 每日一题笔记 日期:2025.03.24 题目:2906.构造乘积矩阵
笔记·leetcode·矩阵