Claude Code 的 Edit 工具是怎么工作的

Claude Code 修改文件的方式不是传行号,也不是打 AST patch。它让模型输出一段要替换的原文 old_string 和替换后的文本 new_string,由 Edit 工具完成实际写入。

这个接口看起来简单------告诉工具"把这段文字换成那段文字"就行了。但真正要把它做稳定,需要回答两个问题:

  1. 模型看到的文件内容和执行编辑时的文件内容之间存在时间差。如果文件在这段时间里被改了,怎么办?
  2. 模型输出的文本和文件里的真实文本不完全一样,怎么办?

下面先看 Edit 的基本结构,然后围绕这两个问题展开。


Edit 工具的基本实现

Edit 通过 buildTool 注册为一个可被模型调用的工具。核心接口包括三部分:给模型看的 Prompt、约束参数的 schema、以及真正执行替换的 call

ts 复制代码
export const FileEditTool = buildTool({
  name: FILE_EDIT_TOOL_NAME,

  async prompt() {
    return getEditToolDescription();
  },

  get inputSchema() {
    return z.strictObject({
      file_path: z.string().describe('The absolute path to the file to modify'),
      old_string: z.string().describe('The text to replace'),
      new_string: z.string().describe('The text to replace it with'),
      replace_all: semanticBoolean(z.boolean().default(false).optional()),
    });
  },

  async call(input, context, _, parentMessage) {
    const { file_path, old_string, new_string, replace_all = false } = input;
    const fileContent = readTextContent(file_path);

    const updatedFile = replace_all
      ? fileContent.replaceAll(old_string, new_string)
      : fileContent.replace(old_string, new_string);

    writeTextContent(file_path, updatedFile);
    return { updatedFile };
  },
});

四个参数的语义:

字段 含义
file_path 要修改的文件绝对路径
old_string 要被替换的原文
new_string 替换后的文本
replace_all 是否替换所有匹配项,默认 false

call 的逻辑很直接:读文件、找 old_string、替换成 new_string、写回磁盘。但 inputSchema 只能约束字段形状,不能告诉模型怎么写参数。所以同一个工具定义里还有 Prompt,把调用规则写清楚:先读文件、保留缩进、默认要求 old_string 唯一、需要全局替换时再使用 replace_all

ts 复制代码
function getEditToolDescription(): string {
  return `Performs exact string replacements in files.

Usage:
- You must use your \`Read\` tool at least once in the conversation before editing.
- When editing text from Read tool output, ensure you preserve the exact indentation.
- The edit will FAIL if \`old_string\` is not unique in the file.
- Use \`replace_all\` for replacing and renaming strings across the file.`;
}

这个最小版本能工作,但它默认了两件事:文件不会在读写之间被改,模型输出的文本一定能和文件内容精确匹配。真实环境里,这两个默认都不成立。


文件在生成过程中被改了怎么办

模型读文件和实际执行编辑之间存在时间窗口。在这个窗口里,用户可能手动改了代码,linter 可能自动格式化了文件,编辑器可能保存了新的内容。如果 Edit 工具不做任何检查,它会基于过时的文件内容执行替换,把用户或 linter 的改动覆盖掉。

readFileState:记住每个文件的最后读取状态

Edit 工具用一个 LRU 缓存 readFileState 跟踪每个文件的最后读取状态:

ts 复制代码
type FileState = {
  content: string; // 读取时的文件内容
  timestamp: number; // Math.floor(mtimeMs)
  offset: number | undefined; // 读取范围起始(全文读取时为 undefined)
  limit: number | undefined; // 读取范围长度(全文读取时为 undefined)
  isPartialView?: boolean; // 自动注入的内容与磁盘不一致时为 true
};

Read 工具读取文件后会写入这个缓存,Edit 工具写入成功后也会更新它。这个缓存是后续所有过期检测的基础。

第一道防线:validateInput 执行前检查

validateInput 在编辑执行之前运行,不写文件,只判断这次编辑是否满足安全执行条件。它同时检查两个问题:

  1. 文件有没有被改过
  2. old_string 能不能匹配上。
ts 复制代码
async function validateInput(input, toolUseContext) {
  const { file_path, old_string, replace_all } = input;
  const fullFilePath = expandPath(file_path);
  const fileContent = readCurrentTextFile(fullFilePath);

  // 1. 文件必须被读过(不能编辑模型没见过的文件)
  const readTimestamp = toolUseContext.readFileState.get(fullFilePath);
  if (!readTimestamp || readTimestamp.isPartialView) {
    return {
      result: false,
      message: 'File has not been read yet.',
      errorCode: 6,
    };
  }

  // 2. 文件自读取后不能被改过
  const lastWriteTime = getFileModificationTime(fullFilePath);
  if (lastWriteTime > readTimestamp.timestamp) {
    const isFullRead =
      readTimestamp.offset === undefined && readTimestamp.limit === undefined;
    const contentUnchanged =
      isFullRead && fileContent === readTimestamp.content;
    if (!contentUnchanged) {
      return {
        result: false,
        message: 'File has been modified since read.',
        errorCode: 7,
      };
    }
  }

  // 3. old_string 必须能匹配到文件内容
  const actualOldString = findActualString(fileContent, old_string);
  if (!actualOldString) {
    return {
      result: false,
      message: 'String to replace not found in file.',
      errorCode: 8,
    };
  }

  // 4. 默认只允许唯一匹配
  const matches = fileContent.split(actualOldString).length - 1;
  if (matches > 1 && !replace_all) {
    return {
      result: false,
      message: `Found ${matches} matches.`,
      errorCode: 9,
    };
  }
}

前两步检查文件是否被改过。有几个细节值得注意:

  • 时间戳比较用的是 Math.floor(mtimeMs),去掉亚毫秒精度,减少时间戳抖动造成的误报。
  • Windows 上云同步、杀毒软件等可能只改时间戳不改内容。所以即使时间戳变了,如果文件是完整读取的且内容没变,仍然允许编辑。
  • isPartialView 标记自动注入的内容(如 CLAUDE.md)与磁盘文件不一致的情况,强制用户先 Read 再编辑。

第三步检查 old_string 能不能匹配上------这里用的 findActualString 会先试精确匹配,失败后把弯引号转成直引号再试,因为 Claude 只能输出直引号但文件里可能用弯引号。 如果引号规范化后仍然匹配不到,直接拒绝。匹配成功后返回的是原始文件里的实际文本,后续替换用真实字符。如果文件用的是弯引号,preserveQuoteStyle 会把 new_string 里的直引号转回弯引号,保持风格一致。

四步检查,每一步失败都有明确的错误码和错误消息,模型可以根据错误信息决定下一步行动:

错误码 含义 模型的下一步
6 文件没读过 先 Read 文件
7 文件被改过了 重新 Read 文件
8 old_string 找不到 换更准确的 old_string
9 匹配到多处 扩大上下文或使用 replace_all

第二道防线:call 写入前再检查一次

validateInput 通过不代表文件就安全了。校验通过到真正写入之间仍然有时间窗口。所以 call 在写入前会重新读取文件并再次检查:

ts 复制代码
async function call(input, { readFileState }) {
  const { file_path, old_string, new_string, replace_all } = input;
  const absoluteFilePath = expandPath(file_path);

  // 重新读取磁盘上的当前内容
  const {
    content: originalFileContents,
    encoding,
    lineEndings,
  } = readFileForEdit(absoluteFilePath);

  // 写入前再次做过期检测
  const lastRead = readFileState.get(absoluteFilePath);
  const lastWriteTime = getFileModificationTime(absoluteFilePath);
  if (!lastRead || lastWriteTime > lastRead.timestamp) {
    const isFullRead =
      lastRead?.offset === undefined && lastRead?.limit === undefined;
    const contentUnchanged =
      isFullRead && originalFileContents === lastRead.content;
    if (!contentUnchanged) {
      // 'File has been unexpectedly modified. Read it again before attempting to write it.'
      throw new Error(FILE_UNEXPECTEDLY_MODIFIED_ERROR);
    }
  }

  // 执行替换并写入...
}

call 把文件读取、过期检查、替换计算、磁盘写入放在一个同步段里,不允许任何异步操作 插入到检查和写入之间。目录创建、文件历史备份等需要 await 的步骤全部安排在这个段之前完成。 检查通过之后如果让出事件循环(比如 await 一个异步操作),别的代码就有机会在这段时间里修改文件,第二道防线就白做了。

为什么只有第一道防线不够?

因为 validateInputcall 之间不是连续执行的。validateInput 返回通过之后,运行时还要做权限检查、等待用户确认、执行 hook 等操作,这些步骤可能耗时数百毫秒甚至更长。在这个窗口里,用户的编辑器可能自动保存了文件,linter 可能格式化了代码,甚至另一个 Claude Code 会话可能刚刚写入了同一个文件。如果只靠 validateInput 的检查结果就直接写入,这些并发修改会被静默覆盖。第二道防线的意义在于:真正写入之前,用同步读取拿到最新的文件内容,再做一次判断------文件变了就拒绝,没变才写入。

写入后更新 readFileState

编辑成功后,call 会更新 readFileState,把文件内容和时间戳设为写入后的值:

ts 复制代码
readFileState.set(absoluteFilePath, {
  content: updatedFile,
  timestamp: getFileModificationTime(absoluteFilePath),
});

这一步容易被忽略,但很关键:如果不更新,下一次连续编辑会把自己刚写入的文件误判为"外部修改",导致所有连续编辑都失败。

文件历史:最后一道恢复线

即使所有检查都通过了,写入仍然可能不是用户期望的。Edit 工具在真正写入之前会调用文件历史机制备份编辑前的内容:

ts 复制代码
await fileHistoryTrackEdit(absoluteFilePath);

备份使用 fs.copyFile() 而不是把文件读内存,存储在 ~/.claude/file-history/ 下。这不是校验机制的一部分,而是恢复机制:前面尽量避免错误写入,后面仍然保留回滚能力。

小结

阶段 检查 失败行为
执行前 validateInput 检查 mtime、匹配和唯一性 拒绝编辑,返回对应错误码
写入前 call 重新读取文件并再次比较 mtime 抛出 FILE_UNEXPECTEDLY_MODIFIED_ERROR
写入后 更新 readFileState 后续编辑基于新内容继续
写入前(备份) fileHistoryTrackEdit 备份原文件 保留恢复能力

总结

Edit 工具的实现揭示了一个更一般的道理:写一个让 LLM 使用的工具,不能信任模型的输出,也要考虑环境的变化,最终靠验证来保证正确性。

不能信任模型的输出,因为模型天然不稳定。它可能记错文件内容,可能输出和原文不完全一致的文本,可能在不该加空格的地方加了空格。Prompt 可以引导它,但无法保证它每次都对。

要考虑环境的变化,因为模型读取文件和执行工具之间存在时间差。在这个窗口里,用户可能改了代码,linter 可能格式化了文件,甚至另一个会话可能刚刚写入了同一个文件。工具执行的时候,世界已经不是模型看到的样子了。工具必须意识到这一点,在关键操作前重新确认环境状态。

最终靠验证来保证正确性。工具层拿到模型的输出后,可以检查文件是否被改过,可以规范化文本后再匹配,可以在写入前再读一次最新内容。能确认安全的,执行;不能确认的,拒绝。已经完成的写入,更新状态并保留恢复入口。

Edit 工具的每一层机制------readFileState 跟踪、mtime 检查、引号规范化、二次读取、文件历史备份------都是这个原则的具体体现。不是让模型永远不犯错,而是在模型输出不可靠、环境随时可能变化的前提下,通过验证保证最终结果的正确性。

如果你觉得这篇文章有帮助,欢迎点赞、收藏,也可以关注我

相关推荐
GetcharZp2 小时前
GitHub 2.4 万 Star!D2 正在重新定义程序员画图方式
后端
沪漂阿龙2 小时前
面试题详解:智能客服 Agent 系统全栈拆解——Rasa Pro、对话管理、意图识别、GraphRAG、Qwen 与 RAG 优化实战
人工智能·架构
辰海Coding4 小时前
MiniSpring框架学习-完成的 IoC 容器
java·spring boot·学习·架构
zhangxingchao4 小时前
多 Agent 架构到底怎么选?从 Claude Agent Teams、Cognition/Devin 到工程落地原则
前端·人工智能·后端
IT_陈寒4 小时前
SpringBoot那个自动配置的坑,害我排查到凌晨三点
前端·人工智能·后端
卡卡军4 小时前
agmd 1.0 重磅升级——Rust 重写,性能起飞
javascript·rust
ServBay4 小时前
OpenCode 和它的7款必备插件
后端·github·ai编程
ping某4 小时前
逐字节拆解 tcpdump
后端
阿凡9807304 小时前
花 100 dollar,用 Claude 打通 EasyEDA&Fusion 双向同步
后端·程序员