个人Agent实践方案

文章目录

一、前言

本文描述了个人使用Agent的实践方案,更好的方案也在探索中,有时间也尽可能会去理解一下其中的机制和原理。注:本文只是个人Agent实践方案,仅供参考,不代表最佳实践方案,后续也会随着对机制的理解的深入而发生改变。

二、最简描述

目前我用过Agent的有Claude Code、DeepSeek Reasonix、OpenClaw、Hermes Agent、GenericAgent。其实还有很多。Hermes Agent和GenericAgent这些应该是偏向自我进化,Claude Code、DeepSeek Reasonix这些偏向编程任务,OpenClaw偏向通用型任务,我个人感觉OpenClaw是目前我觉得使用难度最高的东西,他的界面做的太复杂又全是英文,而且他切换模型的机制也是让人费解,由于OpenClaw的出现,国内也有很多Claw系列出现,但我还没用过所以那些等我用过再说。

首先我们看看DeepSeek的官方接口文档,它教你了怎么实现Claude Code外壳 + DeepSeekV4模型

https://api-docs.deepseek.com/zh-cn/quick_start/agent_integrations/claude_code

windows用户打开PowerShell终端(Vscode里面也可以打开PowerShell终端)

bash 复制代码
$env:ANTHROPIC_BASE_URL="https://api.deepseek.com/anthropic"
$env:ANTHROPIC_AUTH_TOKEN="<你的 DeepSeek API Key>"
$env:ANTHROPIC_MODEL="deepseek-v4-pro[1m]"
$env:ANTHROPIC_DEFAULT_OPUS_MODEL="deepseek-v4-pro[1m]"
$env:ANTHROPIC_DEFAULT_SONNET_MODEL="deepseek-v4-pro[1m]"
$env:ANTHROPIC_DEFAULT_HAIKU_MODEL="deepseek-v4-flash"
$env:CLAUDE_CODE_SUBAGENT_MODEL="deepseek-v4-flash"
$env:CLAUDE_CODE_EFFORT_LEVEL="max"
python 复制代码
cd /path/to/my-project
claude

所以说,如果你用的是其他模型,那么使用Claude Code外壳 + 其他模型的方法也是先看模型的官方接口文档。

个人实践方案是DeepSeek Reasonix + DeepSeek V4,帮助文档如下:

https://api-docs.deepseek.com/zh-cn/quick_start/agent_integrations/reasonix

目前我采用的方案是DeepSeek Reasonix+DeepSeek V4

https://api-docs.deepseek.com/zh-cn/

进入Reasonix的命令:

bash 复制代码
reasonix code .

进入Reasonix之后你就可以跟他对话了,

我在第一次跟它对话的时候就叫他帮我安装了以下内容:

Andrej Karpathy Skills、CodeGraph、Karpathy 的 autoresearch、mempalace(一种记忆机制,可能不需要,因为据说Reasonix自带记忆机制,但我当时不小心装了,)

同时我让它记住一些自己常操作的目录:工作目录,项目总目录、conda环境路径等,要求它在判断项目符合torch兼容性要求的时候直接去conda环境解压我已经安装好torch的conda环境然后重命名为项目名,以避免每次都要在conda环境下载torch。指定工作目录其实是因为默认工作目录是c盘,常常会导致c盘堆的东西越来越多,我需要要求它改到其他盘。

最后要说的就是shift+鼠标选取才可以复制它的对话,这是TUI界面的特殊性。还有就是它默认会是审查模式,在审查模式下它会经常询问你,得到你的允许之后再执行。你可以通过shift+tab来更换模式,可以更换到自动和自由,自动的话它有些可能比较危险的操作还是会询问你,自由模式的话就完全不询问你了,如果你不怕电脑被搞坏,可以设置自由模式。

三、模式切换

要让 DeepSeek Reasonix 进入无需人工确认的模式,核心在于调节它的 editMode(编辑门控) 信任级别。官方提供了三档控制,其中两档可以实现不同程度的自动确认。

方法一:修改配置文件(永久生效)

编辑 ~/.reasonix/config.json(Windows 路径为 %USERPROFILE%\.reasonix\config.json),将 editMode 字段改为 autoyolo

json 复制代码
{
  "apiKey": "sk-...",
  "baseUrl": "https://api.deepseek.com",
  "editMode": "auto",
  ...
}
模式 文件编辑 Shell 命令 适用场景
review 需手动确认 (y/n) 需手动确认 默认安全模式
auto 自动应用 仍需确认 信任编辑但保留命令拦截
yolo 自动应用 自动执行 仅在沙箱/隔离环境使用

官方明确提示:yolo 模式会跳过所有门控,只应在沙箱环境内使用,因为 Shell 命令也会无确认直接执行。

方法二:TUI 内快捷键切换(即时生效)

在 Reasonix 的终端界面(TUI)中运行任务时,直接按:

  • Shift + Tab :在 review(审核)和 AUTO(自动)模式之间切换
  • 该切换会持久化保存,跨会话依然生效

在审核弹窗出现时,你也可以按 y 接受或 n 丢弃当前编辑批次;如果处于 AUTO 模式,编辑会自动应用,但屏幕底部会显示一个 5 秒的撤销横幅,按 u 可撤销最近一批自动应用的修改。

总结

  • 只想自动改代码、但保留命令安全 :设 "editMode": "auto" 或按 Shift+Tab 切到 AUTO。
  • 完全无人值守(包括执行命令) :设 "editMode": "yolo",但务必在容器/沙箱中运行,避免误删文件或执行危险操作。

四、个人Agent实践方案参考资料

1. DeepSeek Reasonix

项目 地址
GitHub https://github.com/esengine/DeepSeek-Reasonix
官网/文档 https://esengine.github.io/DeepSeek-Reasonix/
架构文档 https://github.com/esengine/DeepSeek-Reasonix/blob/main/docs/ARCHITECTURE.md
论文 无独立论文,为开源工程实现

核心定位 :DeepSeek 原生终端 AI Coding Agent,围绕 DeepSeek 的 prefix-cache 机制 设计,主打长会话成本优化(缓存命中率可达 99%+)。

部署实践

bash 复制代码
# 环境要求:Node.js 18+
npm install -g reasonix
# 或克隆源码
git clone https://github.com/esengine/DeepSeek-Reasonix.git
cd DeepSeek-Reasonix && npm install

# 配置 DeepSeek API Key
export DEEPSEEK_API_KEY="sk-..."

# 启动(支持 plan/chat/run 三种模式)
reasonix --mode code

关键特性:支持 MCP 工具调用、四遍工具调用修复、内置成本仪表盘、可配置搜索引擎(Bing/Baidu/SearXNG)。


2. DeepSeek V4(官方接入)

资源 地址
GitHub 组织 https://github.com/deepseek-ai
API 官方文档 https://platform.deepseek.com
HuggingFace 模型卡 https://huggingface.co/deepseek-ai
技术报告 DeepSeek_V4.pdf(随 GitHub/HuggingFace 发布)
论文 无传统学术论文,以技术报告/模型卡形式发布

核心定位:1.6T 总参数、49B 激活参数的 MoE 架构,支持 1M 上下文与多模态输入(文本/图像/视频)。

部署实践(API 接入)

python 复制代码
from openai import OpenAI
import os

client = OpenAI(
    api_key=os.environ["DEEPSEEK_API_KEY"],
    base_url="https://api.deepseek.com"
)

response = client.chat.completions.create(
    model="deepseek-v4-pro",  # 或 deepseek-v4-flash
    messages=[{"role": "user", "content": "..."}],
    extra_body={"thinking": {"type": "enabled"}},
    stream=False
)

本地部署注意:V4 Pro 为 FP8/FP4 权重,需多卡 A100/H100 或重度量化(INT4/INT8)才能在消费级硬件运行;推荐通过 vLLM/TGI 部署。


3. Andrej Karpathy Skills

项目 地址
原始仓库 https://github.com/forrestchang/andrej-karpathy-skills
多 Agent 适配版 https://github.com/swarmclawai/andrej-karpathy-skills
论文 无,为 Agent 行为指南配置库

核心定位 :将 Karpathy 提出的四条编程原则(Think Before Coding / Simplicity First / Surgical Changes / Goal-Driven)打包为 Claude Code、Cursor、Codex、OpenClaw 等工具的 AGENTS.md / CLAUDE.md / SKILL.md 配置文件。

部署实践(以 Claude Code 为例)

bash 复制代码
# 方式一:单项目注入
curl -o CLAUDE.md https://raw.githubusercontent.com/forrestchang/andrej-karpathy-skills/main/CLAUDE.md

# 方式二:作为 Claude Code 插件安装(跨项目生效)
/plugin marketplace add forrestchang/andrej-karpathy-skills
/plugin install andrej-karpathy-skills@karpathy-skills

# 方式三:多 Agent 适配版(支持 Cursor/Copilot/Aider 等)
npx @swarmclawai/andrej-karpathy-skills --agent claude --dest /path/to/project

4. CodeGraph

项目 地址
GitHub https://github.com/colbymchenry/codegraph
npm 包 npm install -g @colbymchenry/codegraph
论文 无独立论文,为工程工具

核心定位 :为 Claude Code / Cursor 等 Agent 提供预索引的语义知识图谱,基于 tree-sitter 提取 AST 符号,使用 SQLite FTS5 构建本地索引,通过 MCP 协议与 Agent 通信。

部署实践

bash 复制代码
npm install -g @colbymchenry/codegraph
codegraph install        # 注册
codegraph init           # 在当前项目构建索引(生成 .codegraph/ 目录)

# 之后 Claude Code 通过 MCP 自动读取索引,加速大型代码库理解

5. Karpathy autoresearch

项目 地址
GitHub https://github.com/karpathy/autoresearch
论文 无独立论文,被多篇 arXiv 论文引用(如 arXiv:2603.17381、2604.18752、2604.13109)

核心定位 :约 630 行 Python 的极简自动研究框架。核心逻辑:Agent 自动修改 train.py → 运行 5 分钟实验 → 验证集损失改善则 git commit,否则 git revert → 循环迭代。人类只需维护一份 program.md 作为研究章程。

部署实践

bash 复制代码
git clone https://github.com/karpathy/autoresearch.git
cd autoresearch

# 环境:Python 3.10+,单 GPU(即使是 4060 Ti 也可跑 nano 级实验)
pip install -r requirements.txt

# 配置 program.md(研究目标与约束)
# 启动自主实验循环
python autoresearch.py --program program.md --budget 5min

关键要求:需要一个真实的轻量级 LLM 训练环境(如 nanoGPT 变体),val loss 是唯一量化目标。


6. MemPalace

项目 地址
原始仓库 https://github.com/milla-jovovich/mempalace
组织仓库 https://github.com/MemPalace/mempalace
论文 无独立论文,被 arXiv 论文引用(如 arXiv:2604.12034、2604.21284)

核心定位:本地优先的 AI 记忆系统,由 Milla Jovovich 与 Ben Sigman 开发。采用**记忆宫殿(Method of Loci)**架构:Wings → Rooms → Halls → Closets → Drawers,所有数据 verbatim 存储于本地 ChromaDB + SQLite,零 API 调用。LongMemEval 原始召回率 96.6%。

部署实践

bash 复制代码
# 环境:Python 3.9+,macOS/Linux/Windows(WSL)
pip install mempalace
# 或
uv pip install mempalace

# 初始化(生成本地 ChromaDB + SQLite 知识图谱)
mempalace init

# 作为 MCP Server 接入 Claude Code / Cursor
mempalace mcp-server --port 8080

关键配置 :如需保护 Claude Code 会话不被 30 天自动清理,需安装 hooks/mempal_save_hook.sh 自动保存钩子。


7. DeliAutoResearch

资源 地址
论文 V1(综述) https://victorchen96.github.io/auto_research_survey.pdf
论文 V2(持续学习) https://victorchen96.github.io/continual_learning_survey.pdf
作者博客 https://victorchen96.github.io/
GitHub 无独立开源仓库 ,为 DeepSeek 研究员陈德利(Deli Chen)自研的 Agent Skill/方法论

核心定位 :陈德利(DeepSeek V1/V2/V3/V4/R1/Coder/MoE 核心贡献者)开发的自主科研 Agent 框架。本质上是基于 CodeAgent 的提示词工程 + 工作流编排,而非独立代码库。论文即为其产出物:V1 为自主科研 Agent 综述(46 页,6 天,108 轮 Agent 交互,64.8 万 tokens),V2 聚焦持续学习与自我迭代。

部署实践(复现其工作流)

由于无开源仓库,需基于其方法论自行搭建:

  1. 核心组件:DeepSeek-V4-Pro(负责文字)+ GPT-Image-2(负责图像)+ CodeAgent(执行环境)
  2. 工作流
    • 编写 program.md 定义研究范围
    • 使用 Agent 循环:文献检索 → 大纲生成 → 章节撰写 → 实验设计(V2)→ 引用核验 → LaTeX 编译
    • 迭代标准:模拟同行评审打分(V1 约 6/10,V2 约 8/10)
  3. 关键技巧
    • 将 AI 生成内容的人类作者声明写为脚注(因 arXiv 不允许 AI 为作者)
    • 使用 git 管理每轮迭代,退化时回滚

汇总表

项目名称 GitHub 论文/文档 部署难度 本地/云端
DeepSeek Reasonix ❌(工程实现) 低(npm) 云端(需 API)
DeepSeek V4 ✅(组织页) 技术报告 中(API)/ 高(本地) 均可
Karpathy Skills ❌(配置库) 极低(复制文件) 本地
CodeGraph ❌(工程工具) 低(npm) 本地
Karpathy autoresearch 被引用 中(需 GPU) 本地
MemPalace 被引用 低(pip) 本地优先
DeliAutoResearch ❌(方法论) ✅(PDF) 高(需自建) 云端(需多模型 API)
相关推荐
Luminbox紫创测控1 小时前
太阳模拟器自动化测试系统:稳态、脉冲、闪光光源的控制与数据采集
人工智能·测试工具·测试标准
有个人神神叨叨1 小时前
Agent Memory 演进主线论文地图
人工智能
DisonTangor1 小时前
微软重磅开源 Lens: 重新思考基础文本到图像模型的训练效率
人工智能·microsoft·ai作画·开源·aigc
Deep-w1 小时前
【MATLAB】基于模型预测控制的自适应巡航车辆过渡工况安全控制研究
开发语言·人工智能·算法·机器学习·matlab
deephub1 小时前
Prompt Engineering 的本质:角色、任务、上下文、格式、约束
人工智能·prompt·大语言模型·多智能体
段一凡-华北理工大学1 小时前
工业领域的Hadoop架构学习~系列文章08:Flink流处理引擎
人工智能·hadoop·学习·架构·flink·高炉炼铁·高炉炼铁智能化
lqjun08271 小时前
PyTorch梯度计算
人工智能·pytorch·python
2601_958352901 小时前
双麦双波束独立拾音:A-59F 让智能工牌与翻译设备“听清每一个方向”
人工智能·语音识别·硬件开发·音频处理模块·消除回音
词元Max1 小时前
3.1 Agent开发需要懂多少数学?
人工智能·python