通识性AI知识点:Token和Context

简单理解:如果把AI大模型想象成一个正在阅读的人,那么 Token(令牌)是它读到的"每一个字词",而Context(上下文/上下文长度)是它"一次性能记住和参考的前面内容的范围"

为了帮你更清晰地理解,我将它们的核心区别和联系总结如下:

特性维度 Token Context
本质 基本处理单位。文本被拆分后的小块。 工作记忆范围。模型单次处理时能"看到"的所有Token的集合。
角色 模型的"输入数据"和"输出材料",像建造用的砖块。 模型的"短期记忆"或"视野范围",像工人手边可用的图纸和参考。
衡量单位 "个" 长度 ,通常用 Token数量 来表示(例如 8K、128K)。
关键限制 影响计费、生成速度。输入输出都按Token数计价。 决定模型单次能处理的信息量。超出范围的Token会被"遗忘"。
常见类比 文章中的字、词、标点 阅读时能记住并参考的前文长度

🔗 它们如何紧密协作

理解了区别后,更要看它们如何共同工作:

  1. Context 是"容器",Token 是"内容" :一个 8K Context 的模型,意味着它能一次性处理最多 8000个 Token。这8000个Token可以全部是用户的提问,也可以是"提问+模型自己刚才生成的回答"。

  2. Context 限制直接影响能力:如果一份文档有1万个Token,但模型的Context只有8K,那么模型无法一次性理解全文。必须将文档拆分,或者采用"滑动窗口"等技巧,这过程中可能会丢失一些信息。

  3. Token是成本与性能的标尺:我们常说的"输入/输出Tokens",就是消耗算力的直接体现。Context的大小则决定了模型单次处理的复杂度上限。

💎 总结与实例

你可以这样记住:

  • Token的维度,回答"有多少信息"。

  • Context的维度,回答"能处理多复杂的信息"。

举个例子:你让AI总结一篇长文章。

  • 首先,文章会被切分成成千上万个 Token 输入给模型。

  • 模型的 Context 长度 决定了它能一次性"吃下"多少内容来总结。如果文章太长,你可能需要分章节提交。

相关推荐
带刺的坐椅13 小时前
从 Claude Code 隐私争议,看 SolonCode 的设计选择
ai·llm·agent·claudecode·soloncode·codingplan
lincats17 小时前
Claude Code项目越写越乱?这套清理流程能救你
ai·ai agent·claude code
云燕实验室CloudLab21 小时前
《AI开始"抱团"思考了!多智能体 + 思维图到底有多强?》
ai·学习工具·智慧学伴
小七-七牛开发者21 小时前
论文解读:DeepSeek DSpark 在真实高并发推理服务中,如何保证 Token 生成又好又快?
ai·大模型·编程·ai coding
doiito1 天前
【Agent Harness】Gliding Horse 核心设计理念,不跟风开发自己的AI Agent
ai·rust·架构设计·系统设计·ai agent
doiito2 天前
【Agent Harness】Gliding Horse 的 L2 作战地图:让多 Agent 协作从“摸黑”变成“透明”
ai·rust·架构设计·系统设计·ai agent
xiezhr2 天前
逛GitHub发现一款免费带有AI功能的数据库管理工具DBX
ai·开源软件·自然语言·数据库管理工具
垚森4 天前
我用 GLM-5.2 造了个炸裂主题后台:16 套主题随心切,可在线体验
ai·react
doiito4 天前
【Agent Harness】Gliding Horse 工具结果压缩体系:如何用“指针”驯服上下文膨胀
ai·rust·架构设计·系统设计·ai agent
doiito5 天前
【Agent Harness】Gliding Horse 上下文动态感知与智能压缩:让 Agent 真正“听得进”每一句话
ai·rust·架构设计·系统设计·ai agent