《给阿嬷的情书》中的“嬷”,与AI概念中的Token、Prompt、上下文窗口

大家有没有到电影院看《给阿嬷的情书》?有没有被电影感动得泪流满面?有没有被阿嬷 是啥意思,这个字怎么读所困扰?

十里不同音,百里不同俗!

不同的地区,随着时间推移,渐渐的都会形成自成一体的语言、风俗与习惯。对于知识而言,同样的道理,时间久了,也会形成自己的一套独立的术语、概念和思想体系,并会不断涌现出大量新的的专有名词,专属概念。

AI也不例外。

你有没有在看新闻、使用AI时,对Token、Prompt、上下文窗口这三个AI专属名词,不明所已?你有没有遇到过这种情况:同样用AI,你写出来的内容总是不如别人?

让你写一封邮件,你得到的是千篇一律的模板;让别人写,却能得到一封直接能发的正式邮件。问题出在哪?

答案可能是:你还没搞懂AI的三个基础概念。

上一篇一首《谦比希铜矿之歌》厂歌火爆全网,背后是AI的数学本质,我们了解了AI的本质与局限,这一篇,我们来聊Token、Prompt、上下文窗口这三个基本概念。掌握它们,你就知道该怎么跟AI说话、该期待什么样的结果、以及什么时候该换模型。

一、Token:AI的"计量单位"

Token(词元)是AI处理信息的基本单位。你可以把它理解为AI世界的"字数"。"词元"是官方给Token的中文名称,但大家日常还是习惯叫Token。

Token是AI运算和训练的最小单位,落到日常使用里,就是输入和输出内容的长度。

一个英文单词大约对应四分之一到一整个Token,中文通常一到两个字算一个Token。

为什么搞懂这个很重要?因为AI的收费和记忆限制,都和Token直接挂钩

你在对话框里输入的所有内容,加上AI的回复,全都会消耗Token。对话太长了,超过AI的"记忆范围",前面的内容就会被丢掉。如果你是通过接口调用AI,Token消耗直接对应账单上的金额。

以DeepSeek为例,它最新的V4版本支持1M Token,大约能处理75万汉字,超过这个长度AI就会开始"失忆"。在收费方面,各模型定价不同,目前DeepSeek属于全球最便宜的梯队。

有个简单的估算方法:字数约等于Token数的一半到三分之一。比如这篇文章大约2000字,消耗约600到1000个Token。

二、Prompt:和AI对话的"语言"

Prompt(提示词)就是你给AI的全部输入,不只是一段话。你上传的图片、粘贴的参考资料、输入的任务描述,全都是Prompt的一部分。

比如你让AI看一张产品设计图,然后问它有什么问题,这张图就是Prompt。你让AI根据一份会议纪要生成行动清单,这份纪要也是Prompt。甚至你上传一份PDF让AI总结,那个PDF还是Prompt。

所以更准确地说:Prompt是AI唯一的输入,你喂给它的所有东西,都算Prompt。

有人可能会问:AI不是挺智能的吗,像和普通人聊天一样跟它对话不行吗?

还真不行。

如果你让同事写一封邮件,只需要说"帮我给张经理写一封邮件",他大概知道你是谁、什么岗位、邮件是写给谁的,也知道这件事的背景,很快就能帮你写出来。

但对AI来说,它既不认识你,也不知道张经理是谁,更不知道你为什么要写这封邮件。

光说"帮我给张经理写一封邮件",AI只能给你一个通用模板。但如果把前因后果说清楚:项目原本定在5月15日上线,因为服务器迁移需要延期一周,希望语气专业但不生硬,对方可以随时联系确认。AI知道足够多的背景信息,才能输出一封你真正能用的邮件。

我们和同事之间几句话能说清楚一件事,是因为共享了身份、工作细节和对话背景。AI没有这些,它只能靠海量数据去猜你可能想要的结果。

**写Prompt的核心,就是在问AI之前把背景交代清楚。**记住三点就够了:

给背景:说清楚前因后果,让AI知道你需要什么。背景越清晰,AI越能给出对路子的回答。

给约束:指定语气、长度、格式等要求。你希望输出正式还是轻松、三百字还是一千字、邮件还是微信文案,这些都要说清楚。

给角色:告诉AI"你是谁",它会自动调整表达方式。说你是一位资深项目经理,AI的语气自然会更专业;说你是大学新生,AI就会更口语化。

举个例子对比一下:

差的Prompt这样说:"帮我写一封邮件"

好的Prompt这样说:"你是一位资深项目经理,需要写一封正式的商务邮件。收件人是合作方的项目经理张经理,语气专业但不生硬。我们合作三年的智能客服项目因为服务器迁移需要延期一周,希望对方理解并保持沟通。邮件需要包含:说明延期情况、表达歉意、承诺后续跟进、留下联系方式,字数控制在三百字以内。"

差别有多大,一试就知道。

三、上下文窗口:AI的"短期记忆"

如果每次和AI对话都要重新交代背景、约束和角色,那AI充其量算一个聪明点的搜索引擎。

**上下文窗口就是AI的短期记忆。**有了上下文,同一个任务里,开头只要交代清楚了,对话没有超过上下文限制,同样的事就不用反复说了。

不同大模型的上下文窗口差异很大。

先看国内的:DeepSeek最新的V4版本支持1M Token,大约75万字,一本大部头著作的量级;它之前的V3版本是128K Token,约16万字;另一家叫Kimi的厂商做到了1.5M Token,约200万字,是目前国内上下文最长的。

再看国外的:ChatGPT最新的GPT-4o版本支持128K Token;Claude最新版本也是128K Token;Gemini最新的2.5 Pro版本达到了1M Token,和DeepSeek站在同一档。

128K Token大约是一本中等长度小说的字数,日常对话、写邮件、写文案绰绰有余。如果要写长文档、分析代码库,128K到1M之间都够用。只有到了"读完整本书再问答"或者"一次性分析几百页PDF"这种场景,才需要用到1M以上的上下文。

当对话长度超过上下文窗口,AI会"忘记"最早的内容,只保留最近的信息。很多人遇到长对话里AI突然"失忆",就是这个原因。

有个实用技巧:如果你的任务需要处理大量内容,可以先让AI总结关键点,再用总结后的内容继续对话。这样做既能节省上下文空间,又能让AI始终"记得"核心信息。

还有一个关键信息:上下文窗口是可以设置的,不是固定的。

不同的AI工具和调用方式,上下文窗口的上限不同,但你可以根据任务需要主动选择。比如同样用DeepSeek的接口,你可以选择用32K上下文跑一个简单任务,这样速度快、费用低;也可以开到128K跑一个复杂任务。上下文越大,AI能"看到"的信息越多,输出的连贯性也越好。

打个比方,就像你看一本书:快速翻阅目录是32K,精读第一章是128K,从头到尾细读是1M。选多大的"窗口",取决于你想让AI看到多完整的信息。

所以上下文窗口不是一个"越大越好"的参数,而是一个需要根据任务匹配的工具。用对了,事半功倍。

小结

三个概念,各有各的作用:

Token 告诉你AI怎么计费、怎么计量;Prompt 决定你能不能从AI那里得到想要的结果;上下文窗口决定了AI能"记住"多少、能处理多长的任务。

把这三个概念搞清楚,你和AI的对话质量就能提升一大截。

很多人在抱怨AI不好用的时候,往往不是AI的问题,而是没有搞清楚这些基础概念。花点时间理解它们,你会发现AI突然"听话"了很多。

用好AI的前提,是先搞清楚它的语言和规则。不会和AI说话,再强大的工具也是浪费。

了解了AI的本质与局限,熟悉了AI这些基础概念,你有没有好奇过,AI是怎么发展到今天的?我们下一篇文章继续!

相关推荐
搬砖的小码农_Sky1 小时前
AI大模型:什么是Token?
人工智能·ai·人机交互·agi
wengqidaifeng1 小时前
3. OpenClaw Skill 开发方法论:从 weather-bit 到 qrcode-gen
ai·openclaw
韦胖漫谈IT1 小时前
选语言不是站队,是选适合问题的工具
java·python·ai·rust·go·技术落地
TangGeeA1 小时前
Codex memories 三个选项的长期记忆实现:读取、生成、更新与清理
ai
searchforAI1 小时前
怎么把视频里的PPT提取出来?视频转图文笔记完整方案
人工智能·笔记·gpt·ai·音视频·语音识别·ppt
弗锐土豆1 小时前
AI-基于RAG架构的分层AI物资编码治理方案
人工智能·ai·架构·物资编码
茉莉玫瑰花茶3 小时前
LangGraph 其他核心能力 [ 1 ]
ai
刘大猫.10 小时前
智造短剧新引擎:火山引擎上线「火山剧创 1.0」,制作效率提升 80%
人工智能·ai·chatgpt·机器人·大模型·火山引擎·短剧新引擎
GHL28427109012 小时前
换脸工作流学习
学习·ai