AI核心知识70——大语言模型之Context Engineering(简洁且通俗易懂版)

上下文工程 (Context Engineering) 是随着大模型上下文窗口(Context Window)越来越大(从 4k 到 100万+ Token)而诞生的一门**"信息整理术"** 。

如果说 Prompt Engineering (提示工程) 是在教 AI "怎么做题"(给指令);

那么 Context Engineering (上下文工程) 就是在帮 AI "准备考试资料"(给数据)。

它的核心目标是:在有限(或昂贵)的窗口内,喂给 AI 最相关、最准确、结构最清晰的信息,让 AI 回答得更好。


1.🗂️ 核心比喻:给 CEO 准备简报

把大模型想象成一个日理万机的 CEO(虽然聪明,但对你的具体业务一无所知)。

你就是那个秘书。

  • 没有上下文工程:

  • 你把公司过去 10 年的所有发票、邮件、会议记录(几万页纸)一股脑扔在 CEO 桌子上,说:"老板,帮我查查去年 3 月亏了多少钱。"

    • 结果:CEO 看不过来,或者看漏了,或者直接发火(报错/胡说八道)。
  • 有上下文工程:

  • 你先筛选出去年 3 月的财务报表,用荧光笔画出重点,整理成一页 A4 纸的简报,放在 CEO 桌子最显眼的地方。

    • 结果:CEO 一眼就看到了答案,决策非常精准。

这就是上下文工程:清洗数据、筛选重点、排版整理。


2.⚔️ Context Engineering vs. Prompt Engineering

这两个词经常混用,但侧重点不同:

|------|---------------------------|-----------------------------|
| 维度 | Prompt Engineering (提示工程) | Context Engineering (上下文工程) |
| 关注点 | 指令 (Instructions) | 数据/背景 (Data/Background) |
| 核心问题 | 我该怎么问,AI 才能听懂? | 我该给 AI 喂哪些资料,它才能答对? |
| 关键动作 | 角色扮演、思维链 (CoT)、约束条件。 | 文档检索 (RAG)、信息排序、内容压缩。 |
| 典型场景 | 写文案、写代码、逻辑推理。 | 知识库问答、读长篇小说、分析财报。 |


3.🛠️ 上下文工程的三大核心技术

当你有 100 个文档想让 AI 读时,你不能随便塞进去,你需要用到以下技巧:

A. 检索与筛选 (Retrieval & Filtering)
  • 痛点:窗口再大也是要钱的,而且废话太多会干扰 AI。

  • 做法 :只把和用户问题最相关 的那 5 个段落找出来(利用 Embedding 向量搜索),喂给 AI。少即是多。

B. 位置优化 (Ordering / Needle in a Haystack)
  • 痛点"中间丢失 (Lost in the Middle)" 现象。大模型往往记得住开头结尾 的信息,但容易忽略中间的信息。

  • 做法 :把最重要的关键信息(Key Information),放在 Prompt 的最前面最后面,千万别埋在中间。

C. 信息压缩 (Compression)
  • 痛点:原文太长,Token 不够用。

  • 做法:先把长文档让 AI 总结成摘要(Summary),然后只把摘要喂给最终的对话模型。


4.🧩 为什么现在它这么重要?

以前窗口小(4k),你想塞东西也塞不进去,所以大家拼命研究 Prompt 技巧。

现在窗口大了(1M+),大家发现**"垃圾进,垃圾出 (Garbage In, Garbage Out)"** 的问题严重了。

  • 场景:基于私有数据构建智能客服。

  • 挑战:公司有 1 万个 PDF 文档。

  • 上下文工程的任务

    • 把 PDF 拆解成小块。

    • 清洗掉乱码和页眉页脚。

    • 加上元数据(Metadata,比如"这是2024年的销售政策")。

    • 当用户问"怎么退货"时,精准调取"退货政策"那一块,而不是把"招聘简章"也塞进去。


总结

上下文工程 (Context Engineering) 是构建企业级 AI 应用(如 RAG 系统)的基本功。

它不再纠结于**"怎么说话"** ,而是专注于**"怎么喂料"**。

如果说 Prompt 是烹饪的厨艺 ,Context 就是食材的预处理。食材洗得越干净、切得越好,做出来的菜(AI 的回答)就越美味。

相关推荐
lifallen15 小时前
Flink Agent:ActionTask 与可续跑状态机 (Coroutine/Continuation)
java·大数据·人工智能·语言模型·flink
数据分析能量站15 小时前
Harnessing Claude 打造高效、低成本、可进化的 AI 应用
人工智能
枫叶林FYL15 小时前
【Python高级工程与架构实战】项目三:实时数据管道(Kafka + Polars + Delta Lake)(一)
人工智能·机器学习
q_354888515315 小时前
计算机毕业设计:Python居民出行规律可视化分析系统 Django框架 可视化 数据分析 PyEcharts 交通 深度学习(建议收藏)✅
人工智能·python·数据分析·车载系统·django·汽车·课程设计
ai生成式引擎优化技术15 小时前
TSPR-WEB-LLM-HIC (TWLH四元结构)AI 生成式引擎(GEO)
人工智能
云上码厂15 小时前
大模型数学库DeepSeek-Math-V2
人工智能
wxl78122715 小时前
驾驭工程 (Harness Engineering):AI Agent 时代的软件工程新范式
人工智能·软件工程
程序员Shawn15 小时前
【深度学习 | 第四篇】- 循环神经网络
人工智能·rnn·深度学习
33三 三like15 小时前
BERT-BiLSTM-CRF 养老需求实体抽取模型解析与实践:从口语文本到结构化知识
人工智能·深度学习·bert
vx_biyesheji000115 小时前
计算机毕业设计:Python城市交通出行模式挖掘系统 Django框架 可视化 数据分析 PyEcharts 交通 深度学习(建议收藏)✅
人工智能·python·深度学习·数据分析·django·汽车·课程设计