【笔记】用cursor手搓cursor（三）简单尝试claude code

prog_61032026-03-26 9:39

最近写着写着发现小模型怎么都不是很好用。

感觉还是技术不到家。openclaw和nanoclaw等开源的也就那样了，于是先把目光投向闭源的claude code。

首先是下载问题，要么你就好好做区域封锁，整个官网 install.sh 会显示区域封锁着呢。然后回头在github上就能暴露下载地址 claude-code-issue-13888: https://storage.googleapis.com/claude-code-dist-86c565f3-f756-42ad-8dfa-d59b1c096819/claude-code-releases/stable

这个就是stable的版本信息，latest是最新版本信息，有了之后继续根据这个 https://storage.googleapis.com/claude-code-dist-86c565f3-f756-42ad-8dfa-d59b1c096819/claude-code-releases 进行后续拼接 /<version>/manifest.json 就可以拿到不同系统和cpu arch的文件列表，然后 /<version>/<os>-<arch>/<claude filename> 就能下载了。

好了，有了闭源的龙虾binary，先玩起来：

bash 复制代码

export OLLAMA_CONTEXT_LENGTH=65536
ollama serve

export ANTHROPIC_BASE_URL=http://localhost:11434
export ANTHROPIC_AUTH_TOKEN=ollama
claude --model qwen3.5:9b

就可以本地跑了，关了telemetry以后，用tcpdump监测下，还是蛮干净的。vim这个binary随便翻一翻，有rust有bun有 ## 的prompt也就大概知道它是如何编译出来的了。网上关于claude code的逆向工程有很多文档了，就不赘述，大家自己看好了。剩下的就是拖到IDA里和文档一起学习了。

claude code的memory和context管理写得相当娴熟，比我的toy好得多，但是在4GB VM里经常OOM。所以还是自己写能控制住内存占用。它确实能让35B模型的执行和推理能力提升不少，但是对于9B模型还是比较难的。所以mac mini要是想自己养龙虾，建议64GB内存运行35B；当然，如果你不怕慢，网上诸如 flash-moe 这样的项目，可以让48GB mac laptop pro 运行 qwen3.5 397B-A17B，真正的cloud级别大模型加持。

harness模式将核心完全托管给LLM，这个模式显然不是我想要的最终形态。但是它能给出一些灵感激发。在进行下一步之前，让我继续好好思考下belief系统，并且继续探索下如果能让35B和claude code配合，能把coding plan规划得更详细------从让claude模型直接写出所有代码变成让qwen 35B模型分解成各个小函数然后拼接出可运行的代码。