《给阿嬷的情书》中的“嬷”，与AI概念中的Token、Prompt、上下文窗口

大家有没有到电影院看《给阿嬷的情书》？有没有被电影感动得泪流满面？有没有被阿嬷是啥意思，嬷这个字怎么读所困扰？

十里不同音，百里不同俗！

不同的地区，随着时间推移，渐渐的都会形成自成一体的语言、风俗与习惯。对于知识而言，同样的道理，时间久了，也会形成自己的一套独立的术语、概念和思想体系，并会不断涌现出大量新的的专有名词，专属概念。

AI也不例外。

你有没有在看新闻、使用AI时，对Token、Prompt、上下文窗口这三个AI专属名词，不明所已？你有没有遇到过这种情况：同样用AI，你写出来的内容总是不如别人？

让你写一封邮件，你得到的是千篇一律的模板；让别人写，却能得到一封直接能发的正式邮件。问题出在哪？

答案可能是：你还没搞懂AI的三个基础概念。

上一篇一首《谦比希铜矿之歌》厂歌火爆全网，背后是AI的数学本质，我们了解了AI的本质与局限，这一篇，我们来聊Token、Prompt、上下文窗口这三个基本概念。掌握它们，你就知道该怎么跟AI说话、该期待什么样的结果、以及什么时候该换模型。

一、Token：AI的"计量单位"

Token（词元）是AI处理信息的基本单位。你可以把它理解为AI世界的"字数"。"词元"是官方给Token的中文名称，但大家日常还是习惯叫Token。

Token是AI运算和训练的最小单位，落到日常使用里，就是输入和输出内容的长度。

一个英文单词大约对应四分之一到一整个Token，中文通常一到两个字算一个Token。

为什么搞懂这个很重要？因为AI的收费和记忆限制，都和Token直接挂钩。

你在对话框里输入的所有内容，加上AI的回复，全都会消耗Token。对话太长了，超过AI的"记忆范围"，前面的内容就会被丢掉。如果你是通过接口调用AI，Token消耗直接对应账单上的金额。

以DeepSeek为例，它最新的V4版本支持1M Token，大约能处理75万汉字，超过这个长度AI就会开始"失忆"。在收费方面，各模型定价不同，目前DeepSeek属于全球最便宜的梯队。

有个简单的估算方法：字数约等于Token数的一半到三分之一。比如这篇文章大约2000字，消耗约600到1000个Token。

二、Prompt：和AI对话的"语言"

Prompt（提示词）就是你给AI的全部输入，不只是一段话。你上传的图片、粘贴的参考资料、输入的任务描述，全都是Prompt的一部分。

比如你让AI看一张产品设计图，然后问它有什么问题，这张图就是Prompt。你让AI根据一份会议纪要生成行动清单，这份纪要也是Prompt。甚至你上传一份PDF让AI总结，那个PDF还是Prompt。

所以更准确地说：Prompt是AI唯一的输入，你喂给它的所有东西，都算Prompt。

有人可能会问：AI不是挺智能的吗，像和普通人聊天一样跟它对话不行吗？

还真不行。

如果你让同事写一封邮件，只需要说"帮我给张经理写一封邮件"，他大概知道你是谁、什么岗位、邮件是写给谁的，也知道这件事的背景，很快就能帮你写出来。

但对AI来说，它既不认识你，也不知道张经理是谁，更不知道你为什么要写这封邮件。

光说"帮我给张经理写一封邮件"，AI只能给你一个通用模板。但如果把前因后果说清楚：项目原本定在5月15日上线，因为服务器迁移需要延期一周，希望语气专业但不生硬，对方可以随时联系确认。AI知道足够多的背景信息，才能输出一封你真正能用的邮件。

我们和同事之间几句话能说清楚一件事，是因为共享了身份、工作细节和对话背景。AI没有这些，它只能靠海量数据去猜你可能想要的结果。

**写Prompt的核心，就是在问AI之前把背景交代清楚。**记住三点就够了：

给背景：说清楚前因后果，让AI知道你需要什么。背景越清晰，AI越能给出对路子的回答。

给约束：指定语气、长度、格式等要求。你希望输出正式还是轻松、三百字还是一千字、邮件还是微信文案，这些都要说清楚。

给角色：告诉AI"你是谁"，它会自动调整表达方式。说你是一位资深项目经理，AI的语气自然会更专业；说你是大学新生，AI就会更口语化。

举个例子对比一下：

差的Prompt这样说："帮我写一封邮件"

好的Prompt这样说："你是一位资深项目经理，需要写一封正式的商务邮件。收件人是合作方的项目经理张经理，语气专业但不生硬。我们合作三年的智能客服项目因为服务器迁移需要延期一周，希望对方理解并保持沟通。邮件需要包含：说明延期情况、表达歉意、承诺后续跟进、留下联系方式，字数控制在三百字以内。"

差别有多大，一试就知道。

三、上下文窗口：AI的"短期记忆"

如果每次和AI对话都要重新交代背景、约束和角色，那AI充其量算一个聪明点的搜索引擎。

**上下文窗口就是AI的短期记忆。**有了上下文，同一个任务里，开头只要交代清楚了，对话没有超过上下文限制，同样的事就不用反复说了。

不同大模型的上下文窗口差异很大。

先看国内的：DeepSeek最新的V4版本支持1M Token，大约75万字，一本大部头著作的量级；它之前的V3版本是128K Token，约16万字；另一家叫Kimi的厂商做到了1.5M Token，约200万字，是目前国内上下文最长的。

再看国外的：ChatGPT最新的GPT-4o版本支持128K Token；Claude最新版本也是128K Token；Gemini最新的2.5 Pro版本达到了1M Token，和DeepSeek站在同一档。

128K Token大约是一本中等长度小说的字数，日常对话、写邮件、写文案绰绰有余。如果要写长文档、分析代码库，128K到1M之间都够用。只有到了"读完整本书再问答"或者"一次性分析几百页PDF"这种场景，才需要用到1M以上的上下文。

当对话长度超过上下文窗口，AI会"忘记"最早的内容，只保留最近的信息。很多人遇到长对话里AI突然"失忆"，就是这个原因。

有个实用技巧：如果你的任务需要处理大量内容，可以先让AI总结关键点，再用总结后的内容继续对话。这样做既能节省上下文空间，又能让AI始终"记得"核心信息。

还有一个关键信息：上下文窗口是可以设置的，不是固定的。

不同的AI工具和调用方式，上下文窗口的上限不同，但你可以根据任务需要主动选择。比如同样用DeepSeek的接口，你可以选择用32K上下文跑一个简单任务，这样速度快、费用低；也可以开到128K跑一个复杂任务。上下文越大，AI能"看到"的信息越多，输出的连贯性也越好。

打个比方，就像你看一本书：快速翻阅目录是32K，精读第一章是128K，从头到尾细读是1M。选多大的"窗口"，取决于你想让AI看到多完整的信息。

所以上下文窗口不是一个"越大越好"的参数，而是一个需要根据任务匹配的工具。用对了，事半功倍。

小结

三个概念，各有各的作用：

Token 告诉你AI怎么计费、怎么计量；Prompt 决定你能不能从AI那里得到想要的结果；上下文窗口决定了AI能"记住"多少、能处理多长的任务。

把这三个概念搞清楚，你和AI的对话质量就能提升一大截。

很多人在抱怨AI不好用的时候，往往不是AI的问题，而是没有搞清楚这些基础概念。花点时间理解它们，你会发现AI突然"听话"了很多。

用好AI的前提，是先搞清楚它的语言和规则。不会和AI说话，再强大的工具也是浪费。

了解了AI的本质与局限，熟悉了AI这些基础概念，你有没有好奇过，AI是怎么发展到今天的？我们下一篇文章继续！