从 Prompt 到 Context Engineering:如何用 StarRocks 构建 AI Agent 的实时上下文引擎?

全球 Lakehouse 架构的部署正在加速普及。然而,一个更深层的范式转变正在悄然发生:企业数据基础设施的服务对象,正在从人向 AI 迁移。

当 AI Agents 开始大规模嵌入企业业务流程,承担分析、决策乃至执行任务时,传统的数据平台架构是否还能胜任?

时至今日,许多企业已经完成了 Lakehouse 的架构升级,却在 AI 规模化落地阶段遭遇了新的瓶颈:数据维度和数据量足够多,但无法支撑 Agent 的高并发探索式查询、无法保障决策数据的准确性、也无法在多 Agent 协作时维持系统的稳定与可治理性。

本文将从工程实践视角,探讨在 AI 时代,大规模 Lakehouse 平台设计面临的困境。

很多人以为,让 AI 表现更好的方法是把提示词写得更精妙。但当你真正开始做企业级 AI Agent,就会发现:问题往往不出在提示词,而出在数据。

一、提示词工程,解决了哪些问题?

过去两年,Prompt Engineering(提示词工程)是 AI 落地最热的词之一。

在 AI 应用的早期阶段,它确实有效------通过精心设计的指令格式、Few-shot 示例、链式推理步骤,能让大模型在同样的任务上输出质量大幅提升。

但当你开始构建企业级 AI Agent 时,一个新的问题出现了:

  • 客服 Agent 的回答忽高忽低,有时准确,有时一本正经地编造;

  • 销售 Copilot 能讲产品逻辑,却不知道眼前这个客户上周刚投诉过;

  • 数据分析 Agent 能写 SQL,却不清楚当前业务口径和真实指标定义。

这些问题,无论你把提示词改多少遍,都很难彻底解决。

因为根本原因不在于模型不会回答,而在于模型没有拿到足够好的上下文。

二、从 Prompt 转向 Context 的新竞争

Context Engineering(上下文工程)是近一年在 AI 工程领域快速兴起的概念。

如果说 Prompt Engineering 是如何问出好问题,那 Context Engineering 解决的是更底层的问题:在模型生成回答之前,如何让它拿到正确、完整、实时的信息环境。

两者的区别,大致可以这样理解:

Prompt Engineering 是在用好现有的模型能力,而 Context Engineering 是在让模型获得它真正需要的信息。

对于企业级 AI Agent,后者往往决定了80% 的实际效果。

三、AI Agent 需要什么样的上下文?

理解了这个转变,下一步自然是:企业在构建 AI Agent 时,应该为它准备什么样的上下文系统?

一个高质量的企业上下文,通常需要满足四个条件:

1. 实时性

Agent 要回答"这个订单现在是什么状态",靠昨晚同步的快照数据是不够的。上下文必须反映当前业务状态,而不是历史快照。

2. 准确性

脏数据、口径冲突、重复记录,进入上下文后,模型不会自动纠错,只会更自信地输出错误结论。业务事实必须经过治理。

3. 跨源整合

企业的上下文往往分散在数据湖、数仓、OLTP、日志系统、CRM 和第三方工具里。Agent 需要一个能跨越这些孤岛、统一检索的能力层。

4. 低延迟可检索

Agent 是在推理链路中实时调用数据的。如果一次上下文检索需要 10 秒,整个 Agent 的响应体验就会崩塌。毫秒级的查询返回,是工程可用性的基本门槛。

这四点加在一起,本质上描述的是一个问题:企业需要一层专门的数据基础设施,来为 AI Agent 提供持续的、高质量的上下文支撑。

四、上下文从哪里来?

用一个具体的场景来说明。假设你在构建一个企业客服 Agent:

  1. 用户提问:"我的退款申请为什么还没处理?"

  2. Agent 判断这个问题需要两类上下文:

• 语义知识:退款政策、处理流程(来自知识库 / 向量检索)

• 业务事实:这个用户的订单状态、退款进度、历史记录(来自实时数据系统)

  1. Agent 并发调用:知识库 + 实时数据查询

  2. 两类上下文合并送入模型,生成回答:

"您的退款申请已于 3 天前提交,目前处于银行处理阶段,预计明天到账。根据我们的政策,大额退款通常需要 3~5 个工作日......

  1. 本次对话状态保留,支持后续追问。

在这个链路里,向量检索负责解决"说什么语气、引用什么知识"的问题,而实时数据查询负责解决"当前业务事实是什么"的问题。

两者缺一不可。但在很多企业的 AI 架构里,第二层几乎是空白的。

五、StarRocks 在这个架构里扮演什么角色?

如果说知识库解决的是语义背景,那 StarRocks 解决的是实时业务事实,这恰恰是大多数企业 AI Agent 最薄弱的那一环。

具体来说,StarRocks 在上下文工程架构中,承担三个关键角色:

角色一:实时数据访问层

Agent 需要查询"这个用户最近 30 天的行为"或"当前库存水位和历史均值的差距",这类查询需要在毫秒到秒级内完成。StarRocks 的向量化执行引擎和 MPP 架构,让实时分析查询可以稳定在极低延迟内返回,满足 Agent 在推理链路中同步调用的需求。

角色二:多源上下文聚合层

企业的业务数据从来不在一个地方。StarRocks 支持对数据湖(如 Hive、Iceberg、Delta Lake)、数据仓和外部数据库进行联邦查询,无需将数据全部搬移入仓,Agent 就能通过一个统一的接口获取跨源上下文,这对那些不想做大规模数据整合工程的团队尤其重要。

角色三:结构化业务事实层

很多 Agent 的上下文质量差,不是因为数据不存在,而是因为数据没有被加工成 Agent 可以直接使用的结构化事实。StarRocks 可以承载预先计算好的用户标签、业务指标、聚合维度,让 Agent 每次调用都能拿到有意义的事实,而不是需要再处理的原始流水。

六、从模型竞争,走向上下文竞争

回到最开始的问题:为什么很多企业的 AI Agent 上线后效果不稳定?

模型能力不是瓶颈,今天主流的大模型已经够强大。真正的瓶颈,是这些模型能否在每一次推理时,都获得准确、实时、完整的企业上下文。

这意味着企业 AI 的竞争,正在从谁用了更好的模型,转向谁能更稳定、更高效地组织上下文。

数据基础设施,正在成为 AI 系统的核心竞争力之一。

StarRocks 不只是一个查询引擎,而是企业将实时数据转化为 AI Agent 可用上下文的关键基础设施层。

随着 Agent 需要持续访问最新的业务状态,这一层的价值,才刚刚开始被认识到。

相关推荐
星空2 小时前
根据Prompt判断用户明确要什么
prompt
张彦峰ZYF2 小时前
LangGraph Tool Calling 入门:从 @tool 到完整调用链
人工智能·大模型·agent·langgraph·tool calling
像风一样自由20203 小时前
量化压缩实战:INT8 / INT4 / AWQ / GPTQ 全面对比
android·人工智能·语言模型·大模型
Wireless_Link3 小时前
AI Agent自动化——可落地的企业效率革命方向深度调研
ai agent·ai智能体
阆遤3 小时前
Windows环境安装Hermes Desktop安装
powershell·ai agent·hermes desktop
嘛也学不会3 小时前
Compact时,大模型干了什么?
人工智能·大模型·agent·压缩上下文·compact
咖啡星人k3 小时前
MonkeyCode Prompt工程实践:如何写出高质量的AI编程需求描述
prompt·ai编程·monkeycode
codefan※3 小时前
Reranker 模型实战:让 RAG 检索精度再提升 20%
大模型·llm·向量数据库·rag
StarRocks_labs4 小时前
StarRocks × Iceberg:联邦查询实践解析
数据库·starrocks·sql·iceberg·物化视图