个人Agent实践方案

文章目录

一、前言
二、最简描述
三、模式切换
- - 方法一：修改配置文件（永久生效）
  - [方法二：TUI 内快捷键切换（即时生效）](#方法二：TUI 内快捷键切换（即时生效）)
  - 总结
四、个人Agent实践方案参考资料
- [1. DeepSeek Reasonix](#1. DeepSeek Reasonix)
- [2. DeepSeek V4（官方接入）](#2. DeepSeek V4（官方接入）)
- [3. Andrej Karpathy Skills](#3. Andrej Karpathy Skills)
- [4. CodeGraph](#4. CodeGraph)
- [5. Karpathy autoresearch](#5. Karpathy autoresearch)
- [6. MemPalace](#6. MemPalace)
- [7. DeliAutoResearch](#7. DeliAutoResearch)
- 汇总表

一、前言

本文描述了个人使用Agent的实践方案，更好的方案也在探索中，有时间也尽可能会去理解一下其中的机制和原理。注：本文只是个人Agent实践方案，仅供参考，不代表最佳实践方案，后续也会随着对机制的理解的深入而发生改变。

二、最简描述

目前我用过Agent的有Claude Code、DeepSeek Reasonix、OpenClaw、Hermes Agent、GenericAgent。其实还有很多。Hermes Agent和GenericAgent这些应该是偏向自我进化，Claude Code、DeepSeek Reasonix这些偏向编程任务，OpenClaw偏向通用型任务，我个人感觉OpenClaw是目前我觉得使用难度最高的东西，他的界面做的太复杂又全是英文，而且他切换模型的机制也是让人费解，由于OpenClaw的出现，国内也有很多Claw系列出现，但我还没用过所以那些等我用过再说。

首先我们看看DeepSeek的官方接口文档，它教你了怎么实现Claude Code外壳 + DeepSeekV4模型

https://api-docs.deepseek.com/zh-cn/quick_start/agent_integrations/claude_code

windows用户打开PowerShell终端（Vscode里面也可以打开PowerShell终端）

bash 复制代码

$env:ANTHROPIC_BASE_URL="https://api.deepseek.com/anthropic"
$env:ANTHROPIC_AUTH_TOKEN="<你的 DeepSeek API Key>"
$env:ANTHROPIC_MODEL="deepseek-v4-pro[1m]"
$env:ANTHROPIC_DEFAULT_OPUS_MODEL="deepseek-v4-pro[1m]"
$env:ANTHROPIC_DEFAULT_SONNET_MODEL="deepseek-v4-pro[1m]"
$env:ANTHROPIC_DEFAULT_HAIKU_MODEL="deepseek-v4-flash"
$env:CLAUDE_CODE_SUBAGENT_MODEL="deepseek-v4-flash"
$env:CLAUDE_CODE_EFFORT_LEVEL="max"

python 复制代码

cd /path/to/my-project
claude

所以说，如果你用的是其他模型，那么使用Claude Code外壳 + 其他模型的方法也是先看模型的官方接口文档。

个人实践方案是DeepSeek Reasonix + DeepSeek V4，帮助文档如下：

https://api-docs.deepseek.com/zh-cn/quick_start/agent_integrations/reasonix

目前我采用的方案是DeepSeek Reasonix+DeepSeek V4

https://api-docs.deepseek.com/zh-cn/

进入Reasonix的命令：

bash 复制代码

reasonix code .

进入Reasonix之后你就可以跟他对话了，

我在第一次跟它对话的时候就叫他帮我安装了以下内容：

Andrej Karpathy Skills、CodeGraph、Karpathy 的 autoresearch、mempalace（一种记忆机制，可能不需要，因为据说Reasonix自带记忆机制，但我当时不小心装了，）

同时我让它记住一些自己常操作的目录：工作目录，项目总目录、conda环境路径等，要求它在判断项目符合torch兼容性要求的时候直接去conda环境解压我已经安装好torch的conda环境然后重命名为项目名，以避免每次都要在conda环境下载torch。指定工作目录其实是因为默认工作目录是c盘，常常会导致c盘堆的东西越来越多，我需要要求它改到其他盘。

最后要说的就是shift+鼠标选取才可以复制它的对话，这是TUI界面的特殊性。还有就是它默认会是审查模式，在审查模式下它会经常询问你，得到你的允许之后再执行。你可以通过shift+tab来更换模式，可以更换到自动和自由，自动的话它有些可能比较危险的操作还是会询问你，自由模式的话就完全不询问你了，如果你不怕电脑被搞坏，可以设置自由模式。

三、模式切换

要让 DeepSeek Reasonix 进入无需人工确认的模式，核心在于调节它的 editMode（编辑门控） 信任级别。官方提供了三档控制，其中两档可以实现不同程度的自动确认。

方法一：修改配置文件（永久生效）

编辑 ~/.reasonix/config.json（Windows 路径为 %USERPROFILE%\.reasonix\config.json），将 editMode 字段改为 auto 或 yolo：

json 复制代码

{
  "apiKey": "sk-...",
  "baseUrl": "https://api.deepseek.com",
  "editMode": "auto",
  ...
}

模式	文件编辑	Shell 命令	适用场景
`review`	需手动确认 (`y`/`n`)	需手动确认	默认安全模式
`auto`	自动应用	仍需确认	信任编辑但保留命令拦截
`yolo`	自动应用	自动执行	仅在沙箱/隔离环境使用

官方明确提示：yolo 模式会跳过所有门控，只应在沙箱环境内使用，因为 Shell 命令也会无确认直接执行。

方法二：TUI 内快捷键切换（即时生效）

在 Reasonix 的终端界面（TUI）中运行任务时，直接按：

Shift + Tab ：在 review（审核）和 AUTO（自动）模式之间切换
该切换会持久化保存，跨会话依然生效

在审核弹窗出现时，你也可以按 y 接受或 n 丢弃当前编辑批次；如果处于 AUTO 模式，编辑会自动应用，但屏幕底部会显示一个 5 秒的撤销横幅，按 u 可撤销最近一批自动应用的修改。

总结

只想自动改代码、但保留命令安全 ：设 "editMode": "auto" 或按 Shift+Tab 切到 AUTO。
完全无人值守（包括执行命令） ：设 "editMode": "yolo"，但务必在容器/沙箱中运行，避免误删文件或执行危险操作。

四、个人Agent实践方案参考资料

1. DeepSeek Reasonix

项目	地址
GitHub	https://github.com/esengine/DeepSeek-Reasonix
官网/文档	https://esengine.github.io/DeepSeek-Reasonix/
架构文档	https://github.com/esengine/DeepSeek-Reasonix/blob/main/docs/ARCHITECTURE.md
论文	无独立论文，为开源工程实现

核心定位 ：DeepSeek 原生终端 AI Coding Agent，围绕 DeepSeek 的 prefix-cache 机制 设计，主打长会话成本优化（缓存命中率可达 99%+）。

部署实践：

bash 复制代码

# 环境要求：Node.js 18+
npm install -g reasonix
# 或克隆源码
git clone https://github.com/esengine/DeepSeek-Reasonix.git
cd DeepSeek-Reasonix && npm install

# 配置 DeepSeek API Key
export DEEPSEEK_API_KEY="sk-..."

# 启动（支持 plan/chat/run 三种模式）
reasonix --mode code

关键特性：支持 MCP 工具调用、四遍工具调用修复、内置成本仪表盘、可配置搜索引擎（Bing/Baidu/SearXNG）。

2. DeepSeek V4（官方接入）

资源	地址
GitHub 组织	https://github.com/deepseek-ai
API 官方文档	https://platform.deepseek.com
HuggingFace 模型卡	https://huggingface.co/deepseek-ai
技术报告	`DeepSeek_V4.pdf`（随 GitHub/HuggingFace 发布）
论文	无传统学术论文，以技术报告/模型卡形式发布

核心定位：1.6T 总参数、49B 激活参数的 MoE 架构，支持 1M 上下文与多模态输入（文本/图像/视频）。

部署实践（API 接入）：

python 复制代码

from openai import OpenAI
import os

client = OpenAI(
    api_key=os.environ["DEEPSEEK_API_KEY"],
    base_url="https://api.deepseek.com"
)

response = client.chat.completions.create(
    model="deepseek-v4-pro",  # 或 deepseek-v4-flash
    messages=[{"role": "user", "content": "..."}],
    extra_body={"thinking": {"type": "enabled"}},
    stream=False
)

本地部署注意：V4 Pro 为 FP8/FP4 权重，需多卡 A100/H100 或重度量化（INT4/INT8）才能在消费级硬件运行；推荐通过 vLLM/TGI 部署。

3. Andrej Karpathy Skills

项目	地址
原始仓库	https://github.com/forrestchang/andrej-karpathy-skills
多 Agent 适配版	https://github.com/swarmclawai/andrej-karpathy-skills
论文	无，为 Agent 行为指南配置库

核心定位 ：将 Karpathy 提出的四条编程原则（Think Before Coding / Simplicity First / Surgical Changes / Goal-Driven）打包为 Claude Code、Cursor、Codex、OpenClaw 等工具的 AGENTS.md / CLAUDE.md / SKILL.md 配置文件。

部署实践（以 Claude Code 为例）：

bash 复制代码

# 方式一：单项目注入
curl -o CLAUDE.md https://raw.githubusercontent.com/forrestchang/andrej-karpathy-skills/main/CLAUDE.md

# 方式二：作为 Claude Code 插件安装（跨项目生效）
/plugin marketplace add forrestchang/andrej-karpathy-skills
/plugin install andrej-karpathy-skills@karpathy-skills

# 方式三：多 Agent 适配版（支持 Cursor/Copilot/Aider 等）
npx @swarmclawai/andrej-karpathy-skills --agent claude --dest /path/to/project

4. CodeGraph

项目	地址
GitHub	https://github.com/colbymchenry/codegraph
npm 包	`npm install -g @colbymchenry/codegraph`
论文	无独立论文，为工程工具

核心定位 ：为 Claude Code / Cursor 等 Agent 提供预索引的语义知识图谱，基于 tree-sitter 提取 AST 符号，使用 SQLite FTS5 构建本地索引，通过 MCP 协议与 Agent 通信。

部署实践：

bash 复制代码

npm install -g @colbymchenry/codegraph
codegraph install        # 注册
codegraph init           # 在当前项目构建索引（生成 .codegraph/ 目录）

# 之后 Claude Code 通过 MCP 自动读取索引，加速大型代码库理解

5. Karpathy autoresearch

项目	地址
GitHub	https://github.com/karpathy/autoresearch
论文	无独立论文，被多篇 arXiv 论文引用（如 arXiv:2603.17381、2604.18752、2604.13109）

核心定位 ：约 630 行 Python 的极简自动研究框架。核心逻辑：Agent 自动修改 train.py → 运行 5 分钟实验 → 验证集损失改善则 git commit，否则 git revert → 循环迭代。人类只需维护一份 program.md 作为研究章程。

部署实践：

bash 复制代码

git clone https://github.com/karpathy/autoresearch.git
cd autoresearch

# 环境：Python 3.10+，单 GPU（即使是 4060 Ti 也可跑 nano 级实验）
pip install -r requirements.txt

# 配置 program.md（研究目标与约束）
# 启动自主实验循环
python autoresearch.py --program program.md --budget 5min

关键要求：需要一个真实的轻量级 LLM 训练环境（如 nanoGPT 变体），val loss 是唯一量化目标。

6. MemPalace

项目	地址
原始仓库	https://github.com/milla-jovovich/mempalace
组织仓库	https://github.com/MemPalace/mempalace
论文	无独立论文，被 arXiv 论文引用（如 arXiv:2604.12034、2604.21284）

核心定位：本地优先的 AI 记忆系统，由 Milla Jovovich 与 Ben Sigman 开发。采用**记忆宫殿（Method of Loci）**架构：Wings → Rooms → Halls → Closets → Drawers，所有数据 verbatim 存储于本地 ChromaDB + SQLite，零 API 调用。LongMemEval 原始召回率 96.6%。

部署实践：

bash 复制代码

# 环境：Python 3.9+，macOS/Linux/Windows(WSL)
pip install mempalace
# 或
uv pip install mempalace

# 初始化（生成本地 ChromaDB + SQLite 知识图谱）
mempalace init

# 作为 MCP Server 接入 Claude Code / Cursor
mempalace mcp-server --port 8080

关键配置 ：如需保护 Claude Code 会话不被 30 天自动清理，需安装 hooks/mempal_save_hook.sh 自动保存钩子。

7. DeliAutoResearch

资源	地址
论文 V1（综述）	https://victorchen96.github.io/auto_research_survey.pdf
论文 V2（持续学习）	https://victorchen96.github.io/continual_learning_survey.pdf
作者博客	https://victorchen96.github.io/
GitHub	无独立开源仓库，为 DeepSeek 研究员陈德利（Deli Chen）自研的 Agent Skill/方法论

核心定位 ：陈德利（DeepSeek V1/V2/V3/V4/R1/Coder/MoE 核心贡献者）开发的自主科研 Agent 框架。本质上是基于 CodeAgent 的提示词工程 + 工作流编排，而非独立代码库。论文即为其产出物：V1 为自主科研 Agent 综述（46 页，6 天，108 轮 Agent 交互，64.8 万 tokens），V2 聚焦持续学习与自我迭代。

部署实践（复现其工作流） ：

由于无开源仓库，需基于其方法论自行搭建：

核心组件：DeepSeek-V4-Pro（负责文字）+ GPT-Image-2（负责图像）+ CodeAgent（执行环境）
工作流 ：
- 编写 program.md 定义研究范围
- 使用 Agent 循环：文献检索 → 大纲生成 → 章节撰写 → 实验设计（V2）→ 引用核验 → LaTeX 编译
- 迭代标准：模拟同行评审打分（V1 约 6/10，V2 约 8/10）
关键技巧 ：
- 将 AI 生成内容的人类作者声明写为脚注（因 arXiv 不允许 AI 为作者）
- 使用 git 管理每轮迭代，退化时回滚

汇总表

项目名称	GitHub	论文/文档	部署难度	本地/云端
DeepSeek Reasonix	✅	❌（工程实现）	低（npm）	云端（需 API）
DeepSeek V4	✅（组织页）	技术报告	中（API）/ 高（本地）	均可
Karpathy Skills	✅	❌（配置库）	极低（复制文件）	本地
CodeGraph	✅	❌（工程工具）	低（npm）	本地
Karpathy autoresearch	✅	被引用	中（需 GPU）	本地
MemPalace	✅	被引用	低（pip）	本地优先
DeliAutoResearch	❌（方法论）	✅（PDF）	高（需自建）	云端（需多模型 API）