我如何用 AI 进行低成本/免费编程

原文：Tom - 2025.08

TL;DR: 快速上手指南

模型与分工:
- 规划与头脑风暴: GLM 4.5、Kimi K2、最新的 Qwen3 Coder 和 2507 系列、Gemini 2.5 Pro (AI Studio)、o4-mini (OpenRouter)、Claude 3.7 或 4 (Poe)。如果你配置了 OpenAI Playground 每日 25 万的免费 token，我建议用 o3 和 GPT 5 把额度用完。
- 解决问题与调试: GPT-5 (Playground 的免费 token)、GLM-4.5 (它简直是个天才，差不多是 Claude 4 的水平)、Claude 4 (Poe 每日免费)。
- 实际编码: 通过 Cline 使用 GPT-4.1；备选方案是 Claude 3.5... 或者一些新模型：Qwen3 Coder、Qwen3 Instruct 2507、GLM 4.5、Kimi K2。
关键工具:
- VS Code
- AI Code Prep GUI -- 在本地扫描和筛选你需要的文件，能节省大量时间。
- Cline (VS Code agent) -- 用于分步执行代码。
- 免费的网页聊天工具（用于获取多角度建议）: Poe.com、ChatGPT、Grok、Deepseek、Perplexity、OpenAI Playground、带有 Gemini 2.5 Pro 的 AI Studio、Openrouter、duck.ai。
简易工作流:
1. 如果项目已存在，运行 AI Code Prep GUI 来打包项目中的相关文件。
2. 将这些上下文粘贴到你喜欢的网页聊天模型中，进行规划和调试。
3. 让其中一个模型"为这些任务写一个详细的 Cline prompt"，然后（比如在 ChatGPT 中）优化它。
4. 将优化后的 prompt 复制/粘贴到设置为 GPT-4.1 的 Cline 中，让它生成或修复代码；如果卡住了，就切换到 Claude 3.5。
省钱小技巧:
- 在 OpenAI Playground 中启用"数据共享"，每天可获得 25 万免费的 GPT-4.5、o3 (这两个都是天才级但昂贵的模型) token，以及 250 万免费的 o4-mini、o3-mini token！！
- 每月 10 美元的 GitHub Copilot 订阅，能让你通过 Cline 有限制地访问 Claude 模型。
- 在 OpenRouter 上按量付费使用 o4-mini、Claude 3.7 和其他新模型。

我的浏览器配置：免费的 AI 自助餐

首先，我的浏览器里会常备一系列指向强大 AI 模型免费版的标签页。既然可以免费获得多种视角，何必只用一个呢？我的常用组合包括：

至少 2-3 个智谱清言 GLM 4.5 的标签页 -- 网页免费，感觉和 Claude 4 不相上下甚至更好！不开玩笑。
1 到 2 个 Kimi K2 的标签页... 另一个类似 Claude 或 Opus 的模型，网站上免费使用。在 GLM 表现得似乎更强之前，Kimi 每天都能帮我修复好几个棘手的 bug。
在 chat.qwen.ai 上使用 Qwen3 Coder 和其他新模型。
至少一个 OpenAI Playground 的标签页。如果你在账户的数据设置中允许 OpenAI 使用你的数据来训练模型，你就能获得免费的 token 来使用 GPT-4.5、o3 等模型。
至少一个，但通常是三个 Google Gemini AI Studio 的标签页 (Gemini 2.5 Pro/Flash 在这里通常是免费且无限制的)。另外，也试试 Google Gemini 2.5 Pro (它和 AI Studio 不同，有更强的图像生成和深度研究能力；我通常会开几个这个的标签页，同时再开几个 AI Studio 的)。
几个 Poe.com 的标签页，通常设置为 Claude 4 或 o4-mini，利用它每天为高级模型提供的免费点数。
几个 OpenRouter 的标签页，设置成不同的模型，有些免费，有些付费。
至少一个 ChatGPT 的标签页 (免费版依然很有用)。
至少一个 Perplexity AI 的标签页，尤其适合需要大量研究的问题。
至少一个 Deepseek 的标签页 (v3 和 r1 在它们的网页界面是免费的，但要注意上下文长度限制)。
一个 Grok.com 的标签页。很好用，免费，而且常规使用和深度研究/图像编辑似乎没有限制。我主要用它的深度研究功能，和 Perplexity 类似。
Phind 是另一个免费工具，它会尝试用流程图/图表来展示结果。
lmarena.ai 提供免费的 Claude Opus 4、Sonnet 4 等模型的访问。免费的 Opus 4 非常棒。

Claude.ai - 免费，但有时限制太多，用起来很烦人，所以我通常通过其他网站/方式来访问 Claude，比如 Cody 插件、Copilot 等。

一个更智能、更便宜的工作流：聚焦上下文

当你在网页聊天（比如 AI Studio、ChatGPT、Openrouter 这些聊天界面，而不是通过 IDE 或 agent 框架）中使用 AI 时，它们在解决问题和提出方案方面几乎总是比 Cline、Trae、Copilot 这类 agent 表现得更好。不总是，但通常是这样。

当你把所有事情都交给 Cursor、Cline、Roo Code 这类工具时，它们会向 AI 发送大量关于如何使用它们工具、如何激活 MCP 服务器、如何编辑文件等的文本，这会过度"拉低 AI 的智商"，让它变得困惑。人们最终不得不花钱购买最昂贵、最顶级的模型来做所有事，但即便如此，也无法克服因 AI 收到大量与问题无关信息而导致的"变笨"效应。

所以当这种情况发生时，我会用我的工具来生成解决问题所需的确切上下文，然后把它粘贴到一个（或多个，因为它们有时会给出不同答案）AI 网页聊天中，直接提问，或者让它做代码审查，试图找出为什么在 y 发生时 x 会出现......等等。当它找到解决方案后，我再让它为 Cline 或其他 agent 类型的工具编写一个 prompt，来执行实际的文件编辑。GPT 4.1 完全能处理这个，而且我的用量是无限的。没必要浪费 Claude 的额度去编辑文件，也没必要给 Claude 发送一堆它不需要的垃圾信息让它变笨。我可以用 Openrouter 的网页聊天，以低廉的成本让 Claude 规划任何事情或修复非常棘手的问题，然后把结果粘贴回 Cline 让它执行就可以了。

这样操作一段时间后，你真的会对哪个模型擅长哪类任务有非常直观的感受。

AI Code Prep 如何提供帮助 (示例 Prompt 结构):

你能帮我搞清楚为什么我的程序出现了 x 而不是 y 吗？

然后，AI Code Prep GUI (支持 Windows、Mac、Linux 和网页版) 就派上用场了。它会递归扫描你的项目文件夹（包括子文件夹、子子文件夹等等），抓取代码，并为 AI 整理成如下格式：

AI Code Prep 生成的上下文块看起来是这样的：

你能帮我搞清楚为什么我的程序出现了 x 而不是 y 吗？

fileName.js:

<code>

... 文件内容 ...

</code>

nextFile.py:

<code>

import example

... 等等 ...

</code>

你能帮我搞清楚为什么我的程序出现了 x 而不是 y 吗？

如果你启用了某个选项，它会把你的问题写两次，这有助于让 AI 更好地专注于你的问题/prompt。你可以选择把问题放在顶部、底部，或者两端都放。OpenAI 声称这有帮助，我没怎么测试过这是否属实，但听起来合乎逻辑。

在 Windows 上，你只需在项目文件夹内（或文件夹本身）的任意位置右键单击，然后从上下文菜单中选择"AI Code Prep GUI"（可以看看网站上的截图）。一个 GUI 窗口会弹出，通常已经预选了正确的代码文件。它会智能地尝试跳过你可能不需要的东西，比如 node_modules、.git 等。如果它的猜测不完美，你可以轻松地勾选或取消勾选文件。

当你的项目非常庞大，超出了 AI 的上下文窗口限制时，这个功能超级有用。你可以手动筛选出 AI 需要看到的确切内容。

许多编码 agent，如 Cline、Github Copilot、Cursor、Windsurf 等，问题在于它们要么发送了太多上下文，要么发送得太少。这就是为什么它们有时看起来很笨或效率低下的原因。有时候，你必须亲自动手，用像我这样的工具自己选择文件，但它能帮你自动选择代码文件，同时跳过你可能不需要的东西（但仍然可以通过复选框添加你想要的内容），然后把这些精选的上下文扔给几个 AI（尤其是那些免费的网页版！）。

当然，也有其他生成上下文的工具，但许多都只有命令行，或者需要一个公开的 GitHub 仓库链接。如果你的代码是私有的怎么办？如果你想让它保持在本地怎么办？如果你更喜欢在 GUI 上用复选框操作呢？对于这样的任务，GUI 显然更合理。

模型策略：为不同任务选择合适的"大脑"

由于许多优秀的模型都可以通过网页界面免费使用（比如 AI Studio 里的 Gemini、Grok、Deepseek），我优先使用这些。Poe.com 每天也为像 Claude 和新的 o4 系列这样的顶级模型提供免费额度。

Gemini 2.5 Pro (通过 AI Studio) 非常适合调试和规划，而且我发现它现在在很多方面都是最棒的。对于特别棘手的问题，我可能会试试新的 o4-mini (可通过 OpenRouter 或 Poe 使用)。它出人意料地立刻修复了一个困扰我很久的 bug，不过我仍在摸索它的最佳用途。值得注意的是，通过 API 使用它比之前像 Claude 3.5/3.7/4 这样的顶级模型要便宜得多。

我通常会在某个时候尝试 Claude 3.7 或 4 ，通过 Poe 或 API (OpenRouter 让这变得很容易)，或者 Github Copilot chat (如果你不付费，也能从中获得一些免费使用次数)，但频繁使用的话价格较贵。可以把 Claude 3.7 和 4 想象成磕了聪明药的 Claude------才华横溢，有时话多，可能有点像亨特·斯托克顿·汤普森那样"疯狂"。它能产出大量精彩内容，但你可能需要一个更冷静的模型，比如 Claude 3.5，来对结果进行提炼或完成实际的编码工作。

对于非常困难的问题，可以试试 OpenAI 的 o3 或者 GLM 4.5、Qwen3 Coder 480b。如果你设置账户允许共享数据以帮助训练模型，每天可以获得大量免费 token。进入 Open AI Playground 页面，点击右上角的设置图标，然后点击左侧边栏的 Data Controls，接着点击显示的页面上的 Sharing，在那里你可以将 "Share inputs and outputs with OpenAI" 设置为 Enabled，这样你将获得：

每天最多 25 万 token，可用于 gpt-5、gpt-4.1、gpt-4o、o1 和 o3。
每天最多 250 万 token，可用于 gpt-4.1-mini、gpt-4.1-nano、gpt-4o-mini、o1-mini、o3-mini、o4-mini 和 codex-mini-latest。

这真的很棒，o3 和 GPT 4.5 看起来超级聪明！有时在 OpenAI Playground 里，我会设置 o3 和 o4-mini 并排使用，以便比较它们。这能帮助我更好地感受哪个模型最适合哪类问题。

Claude 4 和 3.7 永远是快速解决难题的好选择，只是很难以便宜或免费的方式用到它。但它常常是所有模型中最好的。当你真的需要快速修复问题时，就用它吧。Poe 每天为所有模型提供免费 token。OpenRouter 则提供所有模型的付费和/或免费使用。

混合方法：用高级模型规划 + 用平价模型执行

在对各种模型进行大量测试后，我总结出了一套混合策略，可以最大限度地兼顾质量和成本效益。关键在于，不同的模型在开发过程的不同阶段各有专长。

我的"智能果汁"理论 - 模型在特定情况下如何变笨

通常情况下，你发送给 AI 模型的文本越少，它就越聪明。可以把每个模型想象成对你提出的每个问题或难题都有一份固定的"智能"或"智能果汁"。当你发送一个简单、集中的 prompt 时，几乎 100% 的智能都可用于解决你的问题。但是，当你的输入变得复杂------比如冗长的关于如何使用工具的 agent 指令、大量与你特定问题无关的上下文、或者多页代码------那么大部分"智能果汁"就会被用来处理这些无关紧要的东西，比如它如何在你的 IDE 中使用工具，从而留给解决你实际问题的智能能量就变少了。

这就是为什么像 Cursor、Cline 和其他 agent 系统有时看起来效果不佳的原因：如果它们在触及你的真正问题之前，就发送了五大页的指令和上下文，那么模型用于解决你特定问题的可用智能就会下降。你发送的"东西"越多，模型的注意力就越分散。为了获得最佳效果，让你的 prompt 尽可能简洁和有针对性------精心筛选上下文，这样模型就可以将其全部智能用于最重要的事情上。

当遇到难题或 bug 时，使用 AI Code Prep 将其导入网页聊天通常会节省时间（正如本指南前面所讨论的）。它剔除了在 agent 式 IDE/应用中发送的所有额外指令和内容。我注意到，即使你把项目中的所有文件都提供给 AI，这种方法也更有效。那些与你实际问题无关的 agent 指令/内容/冗余信息，似乎是让 AI 变笨/耗尽"智能果汁"的罪魁祸首。

我开始一个新项目时的工作流大致如下：

规划与头脑风暴: 使用更智能/免费的网页模型（Gemini 2.5、o4-mini、Claude 3.7、4、o3 等）来确定方法、规划步骤、选择库等。
生成 Agent Prompt: 问这些智能模型中的一个："为我的 AI 编码 agent Cline 写一个足够详细的 prompt，以完成以下任务：[描述任务]"。有时，我会把这个生成的 prompt 复制粘贴到另一个擅长重写的免费 AI（比如 ChatGPT）中进行进一步优化。
用 Cline 执行: 将这个分步任务列表粘贴到 Cline 中，并将其配置为使用一个稳定高效的模型，如 GPT 4.1 或 Claude 3.5（如果任务非常复杂，则使用 Claude 4）。4.1 系列的模型经过训练，非常擅长遵循指令。
备用方案: 如果 GPT 4.1 搞不定，就把 Cline 切换到通过 API 使用 Claude 3.5 。它似乎是执行任务方面第二可靠的选择。Deepseek v3 或 R1 在遵循指令方面也非常出色。

本质上就是：用昂贵/智能的模型（以及优秀的免费版 Gemini 2.5 Pro）来制定策略和规划。通过将计划粘贴到 2-3 个其他免费模型中（Deepseek R1，如果上下文允许的话，也可以用 Poe 上的 Claude）进行验证，问它们"这个计划好吗？你能改进它或找出其中的缺陷吗？"。然后，在 Cline 中使用像 GPT 4.1 或 Claude 3.5 这样的稳定主力来完成繁重的（编码）工作。

o4-mini 似乎特别擅长理清复杂的代码逻辑或制定高层级的实施策略（比如选择框架或库）。我经常会把我的初步想法扔给 Gemini 2.5、o4-mini、GPT 4.1、ChatGPT，可能还有 o3-mini（可以试试 duck.ai - 通常免费），以及 Phind，以获得一系列的想法。如果免费/便宜的选项解决不了，我就会升级到通过 API 使用更昂贵的模型。

其他可选的 Agent 和配置

Trae.ai (来自字节跳动，也就是 TikTok 的母公司) 是一个免费的、兼容 VS Code 的 IDE，提供免费的 AI 使用，包括 Claude 4、Claude 3.7、Claude 3.5 和 GPT 4.1。它们的 agent 不如 Cline 好用（说实话，没什么比得上 Cline！），但它是免费的，并且能让你用上最好的模型。有时，我发现它内置的 agent 不如 Cline 强大。然而，由于 Trae 似乎是 VS Code 的一个克隆，你很可能可以在其中安装 Cline 插件！但是... 它现在因为用户太多而过载，几乎无法获得任何免费使用，速度太慢了。我还是提一下... 但也就那样吧。

所以，你可以有两种配置：

VS Code + Cline 插件 + Copilot 插件（订阅每月 10 美元的套餐，通过 Cline 获得廉价的 API 访问，不过免费版可能也提供一些基本功能）。
Trae.ai + Cline 插件（如果 Cline 能利用 Trae 的免费模型访问权限，那就能使用，否则就用你自己的 API 密钥）。

两种都试试！有时原生的 Copilot agent 能解决 Cline 搞不定的问题，反之亦然。我怀疑 Cline 有时发送的 prompt 过大，这可能在处理某些任务时，相比于集成度更高的 Copilot agent 会影响性能。

Roo Code: Cline 的克隆版

Roo Code

Roo Code 是 Cline 的一个克隆，非常相似，但有一些不同的功能值得一试。有时 Cline 可能更适合你的工作流程，有时 Roo Code 会更胜一筹。最好两个都试试，看看哪个更适合你特定项目或编码风格的需求。

用于 VS Code 的 Cline 是免费的，但请记住，除非你利用 Copilot 订阅的技巧，否则 API 调用是需要付费的。目前，在 Cline 中使用 VS Code LM API 设置，并配合每月 10 美元的 Copilot 订阅，是在 agent 中以最经济的方式获得强大模型近乎无限访问权限的方法。

新的命令行工具：Claude Code、Qwen Code、Gemini CLI

最近关于编码的新的命令行工具讨论很多，特别是 Claude Code 、Qwen Code 和 Gemini CLI 。人们对 Claude Code 的能力赞不绝口，虽然我自己还没试过。当我尝试时，我计划将其设置为使用 GLM 4.5（z.ai 网站上有相关的指南）。

Claude Code 支持子代理（subagents）------这些代理只执行单一任务，不使用额外的工具。这种设置可以模仿本指南中描述的简化工作流，将模型的智能集中于单一任务。子代理是避免 agent 指令"臃肿"并保持效率的聪明方法。

如果你想进行实验，可以查看配置这些工具的指南和社区技巧。这个生态系统正在迅速发展，每种工具在不同的工作流程中都有其独特的优势。

一些思考

AI 是一个令人难以置信的效率倍增器，但它不是魔杖。真正的魔力发生在你将自己的好奇心、毅力和实验意愿与这些强大的工具相结合时。不要因为 bug 或挫折而灰心------每一个挑战都是学习新东西的机会。混合搭配不同的模型，尝试疯狂的想法，不要害怕打破常规然后重建。最优秀的程序员不是那些从不碰壁的人，而是那些不断前进、利用手头一切工具和技巧的人。拥抱混乱，享受过程，让你的创造力引领方向！