AI核心知识70——大语言模型之Context Engineering(简洁且通俗易懂版)

上下文工程 (Context Engineering) 是随着大模型上下文窗口(Context Window)越来越大(从 4k 到 100万+ Token)而诞生的一门**"信息整理术"** 。

如果说 Prompt Engineering (提示工程) 是在教 AI "怎么做题"(给指令);

那么 Context Engineering (上下文工程) 就是在帮 AI "准备考试资料"(给数据)。

它的核心目标是:在有限(或昂贵)的窗口内,喂给 AI 最相关、最准确、结构最清晰的信息,让 AI 回答得更好。


1.🗂️ 核心比喻:给 CEO 准备简报

把大模型想象成一个日理万机的 CEO(虽然聪明,但对你的具体业务一无所知)。

你就是那个秘书。

  • 没有上下文工程:

  • 你把公司过去 10 年的所有发票、邮件、会议记录(几万页纸)一股脑扔在 CEO 桌子上,说:"老板,帮我查查去年 3 月亏了多少钱。"

    • 结果:CEO 看不过来,或者看漏了,或者直接发火(报错/胡说八道)。
  • 有上下文工程:

  • 你先筛选出去年 3 月的财务报表,用荧光笔画出重点,整理成一页 A4 纸的简报,放在 CEO 桌子最显眼的地方。

    • 结果:CEO 一眼就看到了答案,决策非常精准。

这就是上下文工程:清洗数据、筛选重点、排版整理。


2.⚔️ Context Engineering vs. Prompt Engineering

这两个词经常混用,但侧重点不同:

|------|---------------------------|-----------------------------|
| 维度 | Prompt Engineering (提示工程) | Context Engineering (上下文工程) |
| 关注点 | 指令 (Instructions) | 数据/背景 (Data/Background) |
| 核心问题 | 我该怎么问,AI 才能听懂? | 我该给 AI 喂哪些资料,它才能答对? |
| 关键动作 | 角色扮演、思维链 (CoT)、约束条件。 | 文档检索 (RAG)、信息排序、内容压缩。 |
| 典型场景 | 写文案、写代码、逻辑推理。 | 知识库问答、读长篇小说、分析财报。 |


3.🛠️ 上下文工程的三大核心技术

当你有 100 个文档想让 AI 读时,你不能随便塞进去,你需要用到以下技巧:

A. 检索与筛选 (Retrieval & Filtering)
  • 痛点:窗口再大也是要钱的,而且废话太多会干扰 AI。

  • 做法 :只把和用户问题最相关 的那 5 个段落找出来(利用 Embedding 向量搜索),喂给 AI。少即是多。

B. 位置优化 (Ordering / Needle in a Haystack)
  • 痛点"中间丢失 (Lost in the Middle)" 现象。大模型往往记得住开头结尾 的信息,但容易忽略中间的信息。

  • 做法 :把最重要的关键信息(Key Information),放在 Prompt 的最前面最后面,千万别埋在中间。

C. 信息压缩 (Compression)
  • 痛点:原文太长,Token 不够用。

  • 做法:先把长文档让 AI 总结成摘要(Summary),然后只把摘要喂给最终的对话模型。


4.🧩 为什么现在它这么重要?

以前窗口小(4k),你想塞东西也塞不进去,所以大家拼命研究 Prompt 技巧。

现在窗口大了(1M+),大家发现**"垃圾进,垃圾出 (Garbage In, Garbage Out)"** 的问题严重了。

  • 场景:基于私有数据构建智能客服。

  • 挑战:公司有 1 万个 PDF 文档。

  • 上下文工程的任务

    • 把 PDF 拆解成小块。

    • 清洗掉乱码和页眉页脚。

    • 加上元数据(Metadata,比如"这是2024年的销售政策")。

    • 当用户问"怎么退货"时,精准调取"退货政策"那一块,而不是把"招聘简章"也塞进去。


总结

上下文工程 (Context Engineering) 是构建企业级 AI 应用(如 RAG 系统)的基本功。

它不再纠结于**"怎么说话"** ,而是专注于**"怎么喂料"**。

如果说 Prompt 是烹饪的厨艺 ,Context 就是食材的预处理。食材洗得越干净、切得越好,做出来的菜(AI 的回答)就越美味。

相关推荐
赛博鲁迅2 小时前
物理AI元年:AI走出屏幕进入现实,88API为机器人装上“最强大脑“
人工智能·机器人
管牛牛2 小时前
图像的卷积操作
人工智能·深度学习·计算机视觉
云卓SKYDROID3 小时前
无人机航线辅助模块技术解析
人工智能·无人机·高科技·云卓科技
琅琊榜首20203 小时前
AI生成脑洞付费短篇小说:从灵感触发到内容落地
大数据·人工智能
imbackneverdie4 小时前
近年来,我一直在用的科研工具
人工智能·自然语言处理·aigc·论文·ai写作·学术·ai工具
roman_日积跬步-终至千里4 小时前
【计算机视觉-作业1】从图像到向量:kNN数据预处理完整流程
人工智能·计算机视觉
春日见4 小时前
自动驾驶规划控制决策知识点扫盲
linux·运维·服务器·人工智能·机器学习·自动驾驶
人工智能AI技术4 小时前
【Agent从入门到实践】43 接口封装:将Agent封装为API服务,供其他系统调用
人工智能·python