文章目录
- 一、前言
- 二、最简描述
- 三、模式切换
-
-
- 方法一:修改配置文件(永久生效)
- [方法二:TUI 内快捷键切换(即时生效)](#方法二:TUI 内快捷键切换(即时生效))
- 总结
-
- 四、个人Agent实践方案参考资料
-
- [1. DeepSeek Reasonix](#1. DeepSeek Reasonix)
- [2. DeepSeek V4(官方接入)](#2. DeepSeek V4(官方接入))
- [3. Andrej Karpathy Skills](#3. Andrej Karpathy Skills)
- [4. CodeGraph](#4. CodeGraph)
- [5. Karpathy autoresearch](#5. Karpathy autoresearch)
- [6. MemPalace](#6. MemPalace)
- [7. DeliAutoResearch](#7. DeliAutoResearch)
- 汇总表
一、前言
本文描述了个人使用Agent的实践方案,更好的方案也在探索中,有时间也尽可能会去理解一下其中的机制和原理。注:本文只是个人Agent实践方案,仅供参考,不代表最佳实践方案,后续也会随着对机制的理解的深入而发生改变。
二、最简描述
目前我用过Agent的有Claude Code、DeepSeek Reasonix、OpenClaw、Hermes Agent、GenericAgent。其实还有很多。Hermes Agent和GenericAgent这些应该是偏向自我进化,Claude Code、DeepSeek Reasonix这些偏向编程任务,OpenClaw偏向通用型任务,我个人感觉OpenClaw是目前我觉得使用难度最高的东西,他的界面做的太复杂又全是英文,而且他切换模型的机制也是让人费解,由于OpenClaw的出现,国内也有很多Claw系列出现,但我还没用过所以那些等我用过再说。
首先我们看看DeepSeek的官方接口文档,它教你了怎么实现Claude Code外壳 + DeepSeekV4模型
https://api-docs.deepseek.com/zh-cn/quick_start/agent_integrations/claude_code
windows用户打开PowerShell终端(Vscode里面也可以打开PowerShell终端)
bash
$env:ANTHROPIC_BASE_URL="https://api.deepseek.com/anthropic"
$env:ANTHROPIC_AUTH_TOKEN="<你的 DeepSeek API Key>"
$env:ANTHROPIC_MODEL="deepseek-v4-pro[1m]"
$env:ANTHROPIC_DEFAULT_OPUS_MODEL="deepseek-v4-pro[1m]"
$env:ANTHROPIC_DEFAULT_SONNET_MODEL="deepseek-v4-pro[1m]"
$env:ANTHROPIC_DEFAULT_HAIKU_MODEL="deepseek-v4-flash"
$env:CLAUDE_CODE_SUBAGENT_MODEL="deepseek-v4-flash"
$env:CLAUDE_CODE_EFFORT_LEVEL="max"
python
cd /path/to/my-project
claude
所以说,如果你用的是其他模型,那么使用Claude Code外壳 + 其他模型的方法也是先看模型的官方接口文档。
个人实践方案是DeepSeek Reasonix + DeepSeek V4,帮助文档如下:
https://api-docs.deepseek.com/zh-cn/quick_start/agent_integrations/reasonix
目前我采用的方案是DeepSeek Reasonix+DeepSeek V4
https://api-docs.deepseek.com/zh-cn/
进入Reasonix的命令:
bash
reasonix code .
进入Reasonix之后你就可以跟他对话了,
我在第一次跟它对话的时候就叫他帮我安装了以下内容:
Andrej Karpathy Skills、CodeGraph、Karpathy 的 autoresearch、mempalace(一种记忆机制,可能不需要,因为据说Reasonix自带记忆机制,但我当时不小心装了,)
同时我让它记住一些自己常操作的目录:工作目录,项目总目录、conda环境路径等,要求它在判断项目符合torch兼容性要求的时候直接去conda环境解压我已经安装好torch的conda环境然后重命名为项目名,以避免每次都要在conda环境下载torch。指定工作目录其实是因为默认工作目录是c盘,常常会导致c盘堆的东西越来越多,我需要要求它改到其他盘。
最后要说的就是shift+鼠标选取才可以复制它的对话,这是TUI界面的特殊性。还有就是它默认会是审查模式,在审查模式下它会经常询问你,得到你的允许之后再执行。你可以通过shift+tab来更换模式,可以更换到自动和自由,自动的话它有些可能比较危险的操作还是会询问你,自由模式的话就完全不询问你了,如果你不怕电脑被搞坏,可以设置自由模式。
三、模式切换
要让 DeepSeek Reasonix 进入无需人工确认的模式,核心在于调节它的 editMode(编辑门控) 信任级别。官方提供了三档控制,其中两档可以实现不同程度的自动确认。
方法一:修改配置文件(永久生效)
编辑 ~/.reasonix/config.json(Windows 路径为 %USERPROFILE%\.reasonix\config.json),将 editMode 字段改为 auto 或 yolo:
json
{
"apiKey": "sk-...",
"baseUrl": "https://api.deepseek.com",
"editMode": "auto",
...
}
| 模式 | 文件编辑 | Shell 命令 | 适用场景 |
|---|---|---|---|
review |
需手动确认 (y/n) |
需手动确认 | 默认安全模式 |
auto |
自动应用 | 仍需确认 | 信任编辑但保留命令拦截 |
yolo |
自动应用 | 自动执行 | 仅在沙箱/隔离环境使用 |
官方明确提示:yolo 模式会跳过所有门控,只应在沙箱环境内使用,因为 Shell 命令也会无确认直接执行。
方法二:TUI 内快捷键切换(即时生效)
在 Reasonix 的终端界面(TUI)中运行任务时,直接按:
Shift + Tab:在review(审核)和AUTO(自动)模式之间切换- 该切换会持久化保存,跨会话依然生效
在审核弹窗出现时,你也可以按 y 接受或 n 丢弃当前编辑批次;如果处于 AUTO 模式,编辑会自动应用,但屏幕底部会显示一个 5 秒的撤销横幅,按 u 可撤销最近一批自动应用的修改。
总结
- 只想自动改代码、但保留命令安全 :设
"editMode": "auto"或按Shift+Tab切到 AUTO。 - 完全无人值守(包括执行命令) :设
"editMode": "yolo",但务必在容器/沙箱中运行,避免误删文件或执行危险操作。
四、个人Agent实践方案参考资料
1. DeepSeek Reasonix
| 项目 | 地址 |
|---|---|
| GitHub | https://github.com/esengine/DeepSeek-Reasonix |
| 官网/文档 | https://esengine.github.io/DeepSeek-Reasonix/ |
| 架构文档 | https://github.com/esengine/DeepSeek-Reasonix/blob/main/docs/ARCHITECTURE.md |
| 论文 | 无独立论文,为开源工程实现 |
核心定位 :DeepSeek 原生终端 AI Coding Agent,围绕 DeepSeek 的 prefix-cache 机制 设计,主打长会话成本优化(缓存命中率可达 99%+)。
部署实践:
bash
# 环境要求:Node.js 18+
npm install -g reasonix
# 或克隆源码
git clone https://github.com/esengine/DeepSeek-Reasonix.git
cd DeepSeek-Reasonix && npm install
# 配置 DeepSeek API Key
export DEEPSEEK_API_KEY="sk-..."
# 启动(支持 plan/chat/run 三种模式)
reasonix --mode code
关键特性:支持 MCP 工具调用、四遍工具调用修复、内置成本仪表盘、可配置搜索引擎(Bing/Baidu/SearXNG)。
2. DeepSeek V4(官方接入)
| 资源 | 地址 |
|---|---|
| GitHub 组织 | https://github.com/deepseek-ai |
| API 官方文档 | https://platform.deepseek.com |
| HuggingFace 模型卡 | https://huggingface.co/deepseek-ai |
| 技术报告 | DeepSeek_V4.pdf(随 GitHub/HuggingFace 发布) |
| 论文 | 无传统学术论文,以技术报告/模型卡形式发布 |
核心定位:1.6T 总参数、49B 激活参数的 MoE 架构,支持 1M 上下文与多模态输入(文本/图像/视频)。
部署实践(API 接入):
python
from openai import OpenAI
import os
client = OpenAI(
api_key=os.environ["DEEPSEEK_API_KEY"],
base_url="https://api.deepseek.com"
)
response = client.chat.completions.create(
model="deepseek-v4-pro", # 或 deepseek-v4-flash
messages=[{"role": "user", "content": "..."}],
extra_body={"thinking": {"type": "enabled"}},
stream=False
)
本地部署注意:V4 Pro 为 FP8/FP4 权重,需多卡 A100/H100 或重度量化(INT4/INT8)才能在消费级硬件运行;推荐通过 vLLM/TGI 部署。
3. Andrej Karpathy Skills
| 项目 | 地址 |
|---|---|
| 原始仓库 | https://github.com/forrestchang/andrej-karpathy-skills |
| 多 Agent 适配版 | https://github.com/swarmclawai/andrej-karpathy-skills |
| 论文 | 无,为 Agent 行为指南配置库 |
核心定位 :将 Karpathy 提出的四条编程原则(Think Before Coding / Simplicity First / Surgical Changes / Goal-Driven)打包为 Claude Code、Cursor、Codex、OpenClaw 等工具的 AGENTS.md / CLAUDE.md / SKILL.md 配置文件。
部署实践(以 Claude Code 为例):
bash
# 方式一:单项目注入
curl -o CLAUDE.md https://raw.githubusercontent.com/forrestchang/andrej-karpathy-skills/main/CLAUDE.md
# 方式二:作为 Claude Code 插件安装(跨项目生效)
/plugin marketplace add forrestchang/andrej-karpathy-skills
/plugin install andrej-karpathy-skills@karpathy-skills
# 方式三:多 Agent 适配版(支持 Cursor/Copilot/Aider 等)
npx @swarmclawai/andrej-karpathy-skills --agent claude --dest /path/to/project
4. CodeGraph
| 项目 | 地址 |
|---|---|
| GitHub | https://github.com/colbymchenry/codegraph |
| npm 包 | npm install -g @colbymchenry/codegraph |
| 论文 | 无独立论文,为工程工具 |
核心定位 :为 Claude Code / Cursor 等 Agent 提供预索引的语义知识图谱,基于 tree-sitter 提取 AST 符号,使用 SQLite FTS5 构建本地索引,通过 MCP 协议与 Agent 通信。
部署实践:
bash
npm install -g @colbymchenry/codegraph
codegraph install # 注册
codegraph init # 在当前项目构建索引(生成 .codegraph/ 目录)
# 之后 Claude Code 通过 MCP 自动读取索引,加速大型代码库理解
5. Karpathy autoresearch
| 项目 | 地址 |
|---|---|
| GitHub | https://github.com/karpathy/autoresearch |
| 论文 | 无独立论文,被多篇 arXiv 论文引用(如 arXiv:2603.17381、2604.18752、2604.13109) |
核心定位 :约 630 行 Python 的极简自动研究框架。核心逻辑:Agent 自动修改 train.py → 运行 5 分钟实验 → 验证集损失改善则 git commit,否则 git revert → 循环迭代。人类只需维护一份 program.md 作为研究章程。
部署实践:
bash
git clone https://github.com/karpathy/autoresearch.git
cd autoresearch
# 环境:Python 3.10+,单 GPU(即使是 4060 Ti 也可跑 nano 级实验)
pip install -r requirements.txt
# 配置 program.md(研究目标与约束)
# 启动自主实验循环
python autoresearch.py --program program.md --budget 5min
关键要求:需要一个真实的轻量级 LLM 训练环境(如 nanoGPT 变体),val loss 是唯一量化目标。
6. MemPalace
| 项目 | 地址 |
|---|---|
| 原始仓库 | https://github.com/milla-jovovich/mempalace |
| 组织仓库 | https://github.com/MemPalace/mempalace |
| 论文 | 无独立论文,被 arXiv 论文引用(如 arXiv:2604.12034、2604.21284) |
核心定位:本地优先的 AI 记忆系统,由 Milla Jovovich 与 Ben Sigman 开发。采用**记忆宫殿(Method of Loci)**架构:Wings → Rooms → Halls → Closets → Drawers,所有数据 verbatim 存储于本地 ChromaDB + SQLite,零 API 调用。LongMemEval 原始召回率 96.6%。
部署实践:
bash
# 环境:Python 3.9+,macOS/Linux/Windows(WSL)
pip install mempalace
# 或
uv pip install mempalace
# 初始化(生成本地 ChromaDB + SQLite 知识图谱)
mempalace init
# 作为 MCP Server 接入 Claude Code / Cursor
mempalace mcp-server --port 8080
关键配置 :如需保护 Claude Code 会话不被 30 天自动清理,需安装 hooks/mempal_save_hook.sh 自动保存钩子。
7. DeliAutoResearch
| 资源 | 地址 |
|---|---|
| 论文 V1(综述) | https://victorchen96.github.io/auto_research_survey.pdf |
| 论文 V2(持续学习) | https://victorchen96.github.io/continual_learning_survey.pdf |
| 作者博客 | https://victorchen96.github.io/ |
| GitHub | 无独立开源仓库 ,为 DeepSeek 研究员陈德利(Deli Chen)自研的 Agent Skill/方法论 |
核心定位 :陈德利(DeepSeek V1/V2/V3/V4/R1/Coder/MoE 核心贡献者)开发的自主科研 Agent 框架。本质上是基于 CodeAgent 的提示词工程 + 工作流编排,而非独立代码库。论文即为其产出物:V1 为自主科研 Agent 综述(46 页,6 天,108 轮 Agent 交互,64.8 万 tokens),V2 聚焦持续学习与自我迭代。
部署实践(复现其工作流) :
由于无开源仓库,需基于其方法论自行搭建:
- 核心组件:DeepSeek-V4-Pro(负责文字)+ GPT-Image-2(负责图像)+ CodeAgent(执行环境)
- 工作流 :
- 编写
program.md定义研究范围 - 使用 Agent 循环:文献检索 → 大纲生成 → 章节撰写 → 实验设计(V2)→ 引用核验 → LaTeX 编译
- 迭代标准:模拟同行评审打分(V1 约 6/10,V2 约 8/10)
- 编写
- 关键技巧 :
- 将 AI 生成内容的人类作者声明写为脚注(因 arXiv 不允许 AI 为作者)
- 使用
git管理每轮迭代,退化时回滚
汇总表
| 项目名称 | GitHub | 论文/文档 | 部署难度 | 本地/云端 |
|---|---|---|---|---|
| DeepSeek Reasonix | ✅ | ❌(工程实现) | 低(npm) | 云端(需 API) |
| DeepSeek V4 | ✅(组织页) | 技术报告 | 中(API)/ 高(本地) | 均可 |
| Karpathy Skills | ✅ | ❌(配置库) | 极低(复制文件) | 本地 |
| CodeGraph | ✅ | ❌(工程工具) | 低(npm) | 本地 |
| Karpathy autoresearch | ✅ | 被引用 | 中(需 GPU) | 本地 |
| MemPalace | ✅ | 被引用 | 低(pip) | 本地优先 |
| DeliAutoResearch | ❌(方法论) | ✅(PDF) | 高(需自建) | 云端(需多模型 API) |