AI 相关内容：Agent、MCP、Prompt 与 RAG 入门指南

1、Agent

2、MCP

3、Prompt

RAG

chunking：

embedding：

1、Agent

在人工智能（AI）和计算机科学领域，Agent（智能体） 是指具备自主感知环境、分析信息、制定决策并执行任务能力的软件实体或系统。它并非简单的 "程序"，核心特点是能根据外部环境变化和预设目标，主动调整行为，而非仅被动响应指令。

把在工具、模型、用户之间传话的工具交agent。ai可以通过agent获取工具的信息（查文件，读文件）并执行操作。

工具相关的信息统一格式放在Function calling中（也可能放在systempromrt中）

2、MCP

一个通讯协议，规定了aiagent和工具之间的通信（格式参数等等）

3、Prompt

在人工智能领域中，"prompt" 是指向模型提供输入以引导其生成特定输出的文本或指令。它是与模型进行交互时用户提供的文本段落，用于描述用户想要从模型获取的信息、回答、文本等内容。Prompt 的目的是引导模型产生所需的回应，以便更好地控制生成的输出。

可以分为两类：

user Prompt 用户提示词：用户说的话。
systempromrt系统提示词：描述ai的性格角色背景信息语气等。

流程总结：

1、使用agent，输入用户提示词。

2、agent通过mcp协议获取工具。

3、agent将工具和用户提示词放在一起给到ai模型。

4、ai大模型发现工具，产生调用工具的请求。

5、agent使用工具。

6、将结果返回给ai大模型。

7、ai大模型分析出结果并返回。

视频来源：10分钟讲清楚 Prompt, Agent, MCP 是什么哔哩哔哩bilibili

RAG

什么是ai的幻读？你有一个独特的文档，你想问ai有关这个文档的问题，但是由于ai并没有这个文档，此时ai返回的答案可能与你的文档并没有关系。这时就需要你把文档一起发送给ai大模型，这样就会返回正确的答案了。但是由于你的文档很大不能一次发给ai，这时候就需要找的文档中的相关内容来给到ai。

这个过程就是RAG。Retrieval-Augmented Generation（检索增强生成） ，它是一种结合 "外部知识检索" 与 "大模型生成" 的 AI 技术方案，核心目标是解决大模型的 "知识滞后" 和 "幻觉（生成与事实不符的内容）" 问题，让 AI 能基于特定、最新或私有的知识 生成准确回答。Retrieval-Augmented Generation（检索增强生成） ，它是一种结合 "外部知识检索" 与 "大模型生成" 的 AI 技术方案，核心目标是解决大模型的 "知识滞后" 和 "幻觉（生成与事实不符的内容）" 问题，让 AI 能基于特定、最新或私有的知识生成准确回答。

如何找到文档中相关的内容呢？这时候需要对文档做一个处理。

chunking：

对文字进行切块。分块是将长文档分割为语义连贯的小片段（Chunk）的过程，目的是适配大模型的上下文限制，同时保留内容关联性。分块质量直接影响后续检索的准确性和生成的连贯性。

embedding：

将每段文字转化成向量。嵌入是将文本转化为高维向量（Embedding）的过程，使计算机能够通过数学运算（如余弦相似度）量化文本间的语义关联。向量数据库存储这些向量后，可实现高效的语义检索。

提出问题时使用相同的embedding模型将问题向量化，找到数据库中最相近的来返回。

流程总结

rag存在的问题：

1、语义会分割：比如我是小明。我爱喝饮料。这个句子中我指的是小明，但切分之后我可能就不知道是谁了；

2、缺乏完整性，一个文档返回与问题相关的内容，但是提问"这篇文章出现了几个我"可能就会出现问题。