CLI 工具突然变慢了?别急着怀疑网络,按这四步排查

工具变慢了,本能反应是"网络问题"------重启代理、换节点、关 VPN。但当我真的按层排查下去之后,发现答案和最初的猜测完全不同。

把这次排查整理出来,给同样困惑的同行参考。方法论适用于任何"调用远程服务的 CLI / SDK 工具"------AI 编码助手、API 客户端、上传下载工具都通用。

第 0 步:先知道日志在哪里

很多人卡在"工具变慢"这一步,不是因为不会排查,而是根本不知道这些工具有日志。整理几个常见场景:

  • VSCode / Cursor 扩展Cmd+Shift+P → 输入 Output → 在 Output 面板右上角的下拉里选具体扩展(比如对应的 AI 编码扩展、GitHub CopilotESLint
  • JetBrains 系列Help → Show Log in Finder/Explorer,里面有 idea.log
  • 独立 CLI 工具 :试 --verbose / -v / --debug,或环境变量 DEBUG=1 / <TOOL>_LOG=debug
  • 浏览器扩展chrome://extensions → 找到目标扩展 → 详情 → 「检查视图:背景页」/「Service Worker」

判断日志够不够用的标准:有没有精确到毫秒的时间戳 + 关键事件名。如果只是一行行文本输出没有时间,没法做时序分析,需要换更详细的日志级别。

这一步看似废话,但实际上是后面所有诊断的基石------没有时间戳,"慢"就是个模糊感受,没法量化。

第一步:读日志,看时间戳

打开日志之后,找几个关键事件的时间戳,拆出区间。比如:

makefile 复制代码
23:02:13.987  API REQUEST started
23:02:14.788  Auth check complete
23:02:28.552  Stream started - received first chunk

从这三行能立刻拆出两个区间:

  • 13.987 → 14.788 = 0.8s --- 认证 / 握手开销
  • 14.788 → 28.552 = 13.8s --- 等待服务端首字节(TTFB)

这一步是分流的关键:13.8s 这个数字本身不会告诉你瓶颈在哪,但它把"慢"这个模糊感受变成了具体的可分析数字。下一步要做的是搞清楚------这 13.8s 是网络传输慢,还是服务端处理慢。

第二步:用 curl 隔离网络层

光看 SDK 日志没法判断瓶颈,因为里面混着网络 + 服务端处理两层。要分开,最简单的办法是绕过 SDK,直接用 curl 打同一个 endpoint:

bash 复制代码
curl -o /dev/null -s -w "TTFB: %{time_starttransfer}s\n" https://api.example.com

time_starttransfer 就是从连接发起到收到第一个字节的时间------纯网络 + 服务端最简响应。如果这个值是 0.5s 左右,而你的 SDK 报 13.8s,那 13s 一定不是网络层的事。

更进一步,如果你正在使用本地代理(HTTP 代理或 SOCKS 代理),可以对比两次:

bash 复制代码
# 走代理
curl -x http://127.0.0.1:7890 -o /dev/null -s \
  -w "TTFB: %{time_starttransfer}s\n" https://api.example.com

# 直连
curl --noproxy '*' -o /dev/null -s \
  -w "TTFB: %{time_starttransfer}s\n" https://api.example.com

两个数字差不多 → 代理没拖慢。差异很大 → 代理是一部分原因。

我自己的案例里:两次都是 ~0.5s。也就是说,代理完全不是瓶颈,13.8s 是服务端处理 + 流式生成的时间。

第三步:理解本地代理工具的工作模式

如果第二步发现代理确实拖慢了,那就要进一步分清楚------是代理本身的链路慢,还是代理工具的"工作模式"引入了额外开销。

macOS / Linux 上的本地代理工具通常有两种工作模式:

  • 系统代理(HTTP Proxy) :通过修改系统的 HTTP/HTTPS 代理配置(macOS 上是 networksetup 命令),让进程在发请求时主动走代理端口。优点是开销小、可被进程感知;缺点是某些不读系统代理配置的进程会绕过它。

  • TUN 模式(虚拟网卡):建一块虚拟网卡,把所有流量在 IP 层劫持过去再判断是否转发。优点是真"全局",连不读代理配置的程序也能接管;缺点是多一层封包/解包,对长连接、流式响应(SSE、WebSocket)可能引入额外延迟。

如果你在 TUN 模式下感觉特定流式工具慢,可以切回系统代理对比一下。

macOS 上的一个坑 :切换系统代理需要管理员权限(networksetup 命令要 sudo)。如果你的代理工具的 helper 没正确安装或没获得授权,UI 上点开关会失败但不报错,肉眼看不出来。验证方法:

bash 复制代码
networksetup -getwebproxy "Wi-Fi"

如果 UI 显示开了、命令显示 Enabled: No,那就是 helper 提权机制坏了,不是网络问题。

第四步:排除网络之后,看应用层

走完前三步如果发现网络层没问题,那慢就来自应用层本身。对于调用远程 AI 类服务的工具,应用层的主要时间消耗是:

  1. 模型推理首 token 时间 --- 上下文越长、模型越大、生成越精细,首 token 越慢。一个塞满了上下文的对话,10-20s 首 token 完全正常。
  2. 工具调用 / RAG 检索 --- 在生成前先做一轮检索或工具调用,会叠加延迟。
  3. 服务端排队 --- 高负载时段或限流策略下,请求可能在队列里等待。

这一层基本是用户侧无法优化的------你能做的是:

  • 控制上下文长度(开新会话、清缓存)
  • 选择更轻量的模型(如果工具允许切换)
  • 错峰使用(避开高峰)

一个反直觉的总结

工具变慢的时候,本能反应是"网络问题"。但真按层排查下来,很多时候慢不在网络,而在应用层本身

  • 找到日志面板 → 拿到原始数据
  • 看日志时间戳 → 量化问题
  • curl 隔离 → 分清网络 vs 应用层
  • 切换代理模式 → 分清代理工具 vs 代理链路
  • 排除以上之后 → 才该怀疑模型 / 服务端

排查顺序错了,会浪费几小时调代理配置,最后发现问题压根不在代理上。

速查表

现象 第一反应 真正该做的
工具响应变慢 重启代理 先找到日志面板
看不到日志 当成黑盒放弃 试 Output / --verbose / DEBUG=1
TTFB 高 怀疑网络 curl 打同一 endpoint 做基线
curl 也慢 换代理节点 对比走代理 vs 直连
都没差 没招了 应用层因素:模型、上下文、负载

这套思路对任何"调用远程服务的 CLI"都通用。下次某个工具变慢,先冷静量化,再决定动哪里。

相关推荐
长谷深风1112 小时前
HTTP请求全过程解析【个人八股】
网络·网络协议·http·多线程下载·tcp 连接·请求报文、响应报文·网络请求流程
xhbh6662 小时前
MC端口映射完全教程:路由器虚拟服务器配置+防火墙放行+内网穿透备用方案
运维·服务器·网络·网络协议·tcp/ip·智能路由器·流量端口转发
Ether IC Verifier2 小时前
TCP拥塞控制详解
网络·网络协议·tcp/ip·计算机网络·dpu
Gauss松鼠会2 小时前
GaussDB(DWS) 资源监控Topsql
java·网络·数据库·算法·oracle·性能优化·gaussdb
周易宅2 小时前
Docker MySQL 8.0.45 性能优化配置文档
mysql·docker·性能优化
Ether IC Verifier4 小时前
TCP三次握手与四次挥手详解
网络·网络协议·tcp/ip·计算机网络
pengyi87101511 小时前
独享IP池自动化维护方案,智能检测自动延长使用寿命
网络协议·tcp/ip·自动化
德思特15 小时前
通过 Wireshark 抓取串口命令
网络协议·测试工具·wireshark
丷丩16 小时前
三级缓存下MVT地图瓦片服务性能优化策略
算法·缓存·性能优化·gis·geoai-up