AI核心知识70——大语言模型之Context Engineering(简洁且通俗易懂版)

上下文工程 (Context Engineering) 是随着大模型上下文窗口(Context Window)越来越大(从 4k 到 100万+ Token)而诞生的一门**"信息整理术"** 。

如果说 Prompt Engineering (提示工程) 是在教 AI "怎么做题"(给指令);

那么 Context Engineering (上下文工程) 就是在帮 AI "准备考试资料"(给数据)。

它的核心目标是:在有限(或昂贵)的窗口内,喂给 AI 最相关、最准确、结构最清晰的信息,让 AI 回答得更好。


1.🗂️ 核心比喻:给 CEO 准备简报

把大模型想象成一个日理万机的 CEO(虽然聪明,但对你的具体业务一无所知)。

你就是那个秘书。

  • 没有上下文工程:

  • 你把公司过去 10 年的所有发票、邮件、会议记录(几万页纸)一股脑扔在 CEO 桌子上,说:"老板,帮我查查去年 3 月亏了多少钱。"

    • 结果:CEO 看不过来,或者看漏了,或者直接发火(报错/胡说八道)。
  • 有上下文工程:

  • 你先筛选出去年 3 月的财务报表,用荧光笔画出重点,整理成一页 A4 纸的简报,放在 CEO 桌子最显眼的地方。

    • 结果:CEO 一眼就看到了答案,决策非常精准。

这就是上下文工程:清洗数据、筛选重点、排版整理。


2.⚔️ Context Engineering vs. Prompt Engineering

这两个词经常混用,但侧重点不同:

|------|---------------------------|-----------------------------|
| 维度 | Prompt Engineering (提示工程) | Context Engineering (上下文工程) |
| 关注点 | 指令 (Instructions) | 数据/背景 (Data/Background) |
| 核心问题 | 我该怎么问,AI 才能听懂? | 我该给 AI 喂哪些资料,它才能答对? |
| 关键动作 | 角色扮演、思维链 (CoT)、约束条件。 | 文档检索 (RAG)、信息排序、内容压缩。 |
| 典型场景 | 写文案、写代码、逻辑推理。 | 知识库问答、读长篇小说、分析财报。 |


3.🛠️ 上下文工程的三大核心技术

当你有 100 个文档想让 AI 读时,你不能随便塞进去,你需要用到以下技巧:

A. 检索与筛选 (Retrieval & Filtering)
  • 痛点:窗口再大也是要钱的,而且废话太多会干扰 AI。

  • 做法 :只把和用户问题最相关 的那 5 个段落找出来(利用 Embedding 向量搜索),喂给 AI。少即是多。

B. 位置优化 (Ordering / Needle in a Haystack)
  • 痛点"中间丢失 (Lost in the Middle)" 现象。大模型往往记得住开头结尾 的信息,但容易忽略中间的信息。

  • 做法 :把最重要的关键信息(Key Information),放在 Prompt 的最前面最后面,千万别埋在中间。

C. 信息压缩 (Compression)
  • 痛点:原文太长,Token 不够用。

  • 做法:先把长文档让 AI 总结成摘要(Summary),然后只把摘要喂给最终的对话模型。


4.🧩 为什么现在它这么重要?

以前窗口小(4k),你想塞东西也塞不进去,所以大家拼命研究 Prompt 技巧。

现在窗口大了(1M+),大家发现**"垃圾进,垃圾出 (Garbage In, Garbage Out)"** 的问题严重了。

  • 场景:基于私有数据构建智能客服。

  • 挑战:公司有 1 万个 PDF 文档。

  • 上下文工程的任务

    • 把 PDF 拆解成小块。

    • 清洗掉乱码和页眉页脚。

    • 加上元数据(Metadata,比如"这是2024年的销售政策")。

    • 当用户问"怎么退货"时,精准调取"退货政策"那一块,而不是把"招聘简章"也塞进去。


总结

上下文工程 (Context Engineering) 是构建企业级 AI 应用(如 RAG 系统)的基本功。

它不再纠结于**"怎么说话"** ,而是专注于**"怎么喂料"**。

如果说 Prompt 是烹饪的厨艺 ,Context 就是食材的预处理。食材洗得越干净、切得越好,做出来的菜(AI 的回答)就越美味。

相关推荐
情绪总是阴雨天~18 分钟前
OpenClaw 核心机制深度讲解:开源个人 AI 智能体全解析
人工智能·开源
星越华夏6 小时前
计算机视觉:YOLOv12安装环境
人工智能·yolo·计算机视觉
weixin_449290017 小时前
Dify 三模式安全配置清单
ai
Yolanda948 小时前
【人工智能】《从零搭建AI问答助手项目(九):Prompt优化》
人工智能·prompt
wj3055853788 小时前
课程 9:模型测试记录与 Prompt 策略
linux·人工智能·python·comfyui
小和尚同志8 小时前
深入使用 skill-creator:结合真实生产级实践
人工智能·aigc
DevSecOps选型指南8 小时前
安全419专访悬镜安全 | 穿越周期在 AI 浪潮中定义数字供应链安全新范式
人工智能
沪漂阿龙8 小时前
面试题详解:GraphRAG 全面解析——知识图谱增强 RAG、Local Search、Global Search、社区摘要、工程落地与评估指标一次讲透
人工智能·知识图谱
WangN28 小时前
Unitree RL Lab 学习笔记【通识】
人工智能·机器学习
haina20198 小时前
海纳AI亮相《科创中国》,解码招聘“智”变之路
人工智能·ai面试·ai招聘