AI核心知识70——大语言模型之Context Engineering(简洁且通俗易懂版)

上下文工程 (Context Engineering) 是随着大模型上下文窗口(Context Window)越来越大(从 4k 到 100万+ Token)而诞生的一门**"信息整理术"** 。

如果说 Prompt Engineering (提示工程) 是在教 AI "怎么做题"(给指令);

那么 Context Engineering (上下文工程) 就是在帮 AI "准备考试资料"(给数据)。

它的核心目标是:在有限(或昂贵)的窗口内,喂给 AI 最相关、最准确、结构最清晰的信息,让 AI 回答得更好。


1.🗂️ 核心比喻:给 CEO 准备简报

把大模型想象成一个日理万机的 CEO(虽然聪明,但对你的具体业务一无所知)。

你就是那个秘书。

  • 没有上下文工程:

  • 你把公司过去 10 年的所有发票、邮件、会议记录(几万页纸)一股脑扔在 CEO 桌子上,说:"老板,帮我查查去年 3 月亏了多少钱。"

    • 结果:CEO 看不过来,或者看漏了,或者直接发火(报错/胡说八道)。
  • 有上下文工程:

  • 你先筛选出去年 3 月的财务报表,用荧光笔画出重点,整理成一页 A4 纸的简报,放在 CEO 桌子最显眼的地方。

    • 结果:CEO 一眼就看到了答案,决策非常精准。

这就是上下文工程:清洗数据、筛选重点、排版整理。


2.⚔️ Context Engineering vs. Prompt Engineering

这两个词经常混用,但侧重点不同:

|------|---------------------------|-----------------------------|
| 维度 | Prompt Engineering (提示工程) | Context Engineering (上下文工程) |
| 关注点 | 指令 (Instructions) | 数据/背景 (Data/Background) |
| 核心问题 | 我该怎么问,AI 才能听懂? | 我该给 AI 喂哪些资料,它才能答对? |
| 关键动作 | 角色扮演、思维链 (CoT)、约束条件。 | 文档检索 (RAG)、信息排序、内容压缩。 |
| 典型场景 | 写文案、写代码、逻辑推理。 | 知识库问答、读长篇小说、分析财报。 |


3.🛠️ 上下文工程的三大核心技术

当你有 100 个文档想让 AI 读时,你不能随便塞进去,你需要用到以下技巧:

A. 检索与筛选 (Retrieval & Filtering)
  • 痛点:窗口再大也是要钱的,而且废话太多会干扰 AI。

  • 做法 :只把和用户问题最相关 的那 5 个段落找出来(利用 Embedding 向量搜索),喂给 AI。少即是多。

B. 位置优化 (Ordering / Needle in a Haystack)
  • 痛点"中间丢失 (Lost in the Middle)" 现象。大模型往往记得住开头结尾 的信息,但容易忽略中间的信息。

  • 做法 :把最重要的关键信息(Key Information),放在 Prompt 的最前面最后面,千万别埋在中间。

C. 信息压缩 (Compression)
  • 痛点:原文太长,Token 不够用。

  • 做法:先把长文档让 AI 总结成摘要(Summary),然后只把摘要喂给最终的对话模型。


4.🧩 为什么现在它这么重要?

以前窗口小(4k),你想塞东西也塞不进去,所以大家拼命研究 Prompt 技巧。

现在窗口大了(1M+),大家发现**"垃圾进,垃圾出 (Garbage In, Garbage Out)"** 的问题严重了。

  • 场景:基于私有数据构建智能客服。

  • 挑战:公司有 1 万个 PDF 文档。

  • 上下文工程的任务

    • 把 PDF 拆解成小块。

    • 清洗掉乱码和页眉页脚。

    • 加上元数据(Metadata,比如"这是2024年的销售政策")。

    • 当用户问"怎么退货"时,精准调取"退货政策"那一块,而不是把"招聘简章"也塞进去。


总结

上下文工程 (Context Engineering) 是构建企业级 AI 应用(如 RAG 系统)的基本功。

它不再纠结于**"怎么说话"** ,而是专注于**"怎么喂料"**。

如果说 Prompt 是烹饪的厨艺 ,Context 就是食材的预处理。食材洗得越干净、切得越好,做出来的菜(AI 的回答)就越美味。

相关推荐
会飞的老朱3 小时前
医药集团数智化转型,智能综合管理平台激活集团管理新效能
大数据·人工智能·oa协同办公
聆风吟º5 小时前
CANN runtime 实战指南:异构计算场景中运行时组件的部署、调优与扩展技巧
人工智能·神经网络·cann·异构计算
寻星探路5 小时前
【深度长文】万字攻克网络原理:从 HTTP 报文解构到 HTTPS 终极加密逻辑
java·开发语言·网络·python·http·ai·https
想用offer打牌6 小时前
MCP (Model Context Protocol) 技术理解 - 第二篇
后端·aigc·mcp
Codebee7 小时前
能力中心 (Agent SkillCenter):开启AI技能管理新时代
人工智能
聆风吟º8 小时前
CANN runtime 全链路拆解:AI 异构计算运行时的任务管理与功能适配技术路径
人工智能·深度学习·神经网络·cann
uesowys8 小时前
Apache Spark算法开发指导-One-vs-Rest classifier
人工智能·算法·spark
AI_56788 小时前
AWS EC2新手入门:6步带你从零启动实例
大数据·数据库·人工智能·机器学习·aws
User_芊芊君子8 小时前
CANN大模型推理加速引擎ascend-transformer-boost深度解析:毫秒级响应的Transformer优化方案
人工智能·深度学习·transformer