RAG & Grounding - 技术栈

众所周知LLM是已经训练好的AI模型，仅能掌握其在通用领域内的内容回复。

模型默认是不知道特定企业的财务，订单状态，私有文档等等数据。

而在企业环境中，Hallucination(AI 幻觉)又非常的危险，因为AI可能会生成错误的订单号，错误的合同内容，编造出来的条款。这就是 Grounding 要解决的核心问题。

Grounding所做的事情就是让模型基于真实数据进行回答。

LLM天生存在"知识截止时间"（knowledge cutoff），这意味着它们无法访问实时数据或企业的专有信息。当模型遇到知识缺口时，可能会生成听起来可信但实际上错误或虚构的信息。在企业级应用场景中，准确性和可信度是不可妥协的要求，因此必须克服这些固有限制。

在 SAP Business AI 的语境下，Grounding 指的是将 AI 的输出锚定在可靠的、特定情境下的、事实性数据之上。其核心原则是确保 LLM 的回答不仅流畅，而且准确、可信，并且与组织内部知识或经过验证的外部数据直接对齐。

通过确保回答来源于可信数据源（例如 SAP 系统、内部文档或经过筛选的外部数据库），Grounding 可以：

Retrieval-Augmented Generation, 检索增强生成。

RAG 提供了一种架构模式和工作流程，用于系统性地实现 Grounding。RAG可以通过从外部知识库或数据库中检索相关数据，并利用这些数据增强 LLM 的生成能力，从而确保模型能够访问实时、特定领域的信息，生成与情境相关且基于事实的输出。

RAG 的工作流程:

当应用收到用户问题（例如："销售订单 12345 的状态是什么？"）时，首先会触发检索流程。

该流程会搜索预设的内部数据源（例如 SAP S/4HANA、CRM、内部文档、数据库或数据湖），寻找与该问题高度相关的信息。通常涉及：

检索到的权威信息会被动态加入发送给 LLM 的 Prompt 中。

这意味着，模型收到的不仅是用户问题，还有它回答所需的具体、可验证事实。

这一关键步骤实现了对 LLM 的"Grounding"。

在增强后的 Prompt 基础上，LLM 生成回答。

由于必要的事实已明确包含在上下文中，模型能够生成：准确，情境相关，无幻觉，基于真实来源的结果

Grounding 是目标, RAG 是实现 Grounding 的主流方法，尤其在企业场景中极具价值，因为企业应用通常需要实时数据与专有数据支持。

内部 IT 支持
员工问：如何重置 SAP 密码？
没有 RAG：模型可能生成通用答案,与公司政策不一致,提供错误步骤
有 RAG：系统从内部 IT 文档中检索最新版本,把步骤作为上下文,模型基于真实文档生成回答
客服场景
客户问：这个产品的保修期多久？
RAG 流程：检索产品规格书，检索维修政策，检索地区差异条款，基于真实数据生成回答
HR场景
员工问：国际航班报销标准是多少？
RAG 可以：检索最新 HR 手册，检索地区补充政策，检索差旅等级规则