AI 相关内容:Agent、MCP、Prompt 与 RAG 入门指南

目录

1、Agent

2、MCP

3、Prompt

RAG

chunking:

embedding:


1、Agent

在人工智能(AI)和计算机科学领域,Agent(智能体) 是指具备自主感知环境、分析信息、制定决策并执行任务能力的软件实体或系统。它并非简单的 "程序",核心特点是能根据外部环境变化和预设目标,主动调整行为,而非仅被动响应指令。

把在工具、模型、用户之间传话的工具交agent。ai可以通过agent获取工具的信息(查文件,读文件)并执行操作。

工具相关的信息统一格式放在Function calling中(也可能放在systempromrt中)

2、MCP

一个通讯协议,规定了aiagent和工具之间的通信(格式参数等等)

3、Prompt

在人工智能领域中,"prompt" 是指向模型提供输入以引导其生成特定输出的文本或指令。它是与模型进行交互时用户提供的文本段落,用于描述用户想要从模型获取的信息、回答、文本等内容。Prompt 的目的是引导模型产生所需的回应,以便更好地控制生成的输出。

可以分为两类:

user Prompt 用户提示词:用户说的话。
systempromrt系统提示词:描述ai的性格角色背景信息语气等。

流程总结:

1、使用agent,输入用户提示词。

2、agent通过mcp协议获取工具。

3、agent将工具和用户提示词放在一起给到ai模型。

4、ai大模型发现工具,产生调用工具的请求。

5、agent使用工具。

6、将结果返回给ai大模型。

7、ai大模型分析出结果并返回。

视频来源:10分钟讲清楚 Prompt, Agent, MCP 是什么哔哩哔哩bilibili

RAG

什么是ai的幻读?你有一个独特的文档,你想问ai有关这个文档的问题,但是由于ai并没有这个文档,此时ai返回的答案可能与你的文档并没有关系。 这时就需要你把文档一起发送给ai大模型,这样就会返回正确的答案了。但是由于你的文档很大不能一次发给ai,这时候就需要找的文档中的相关内容来给到ai。

这个过程就是RAG。Retrieval-Augmented Generation(检索增强生成) ,它是一种结合 "外部知识检索" 与 "大模型生成" 的 AI 技术方案,核心目标是解决大模型的 "知识滞后" 和 "幻觉(生成与事实不符的内容)" 问题,让 AI 能基于特定、最新或私有的知识 生成准确回答。Retrieval-Augmented Generation(检索增强生成) ,它是一种结合 "外部知识检索" 与 "大模型生成" 的 AI 技术方案,核心目标是解决大模型的 "知识滞后" 和 "幻觉(生成与事实不符的内容)" 问题,让 AI 能基于特定、最新或私有的知识生成准确回答。

如何找到文档中相关的内容呢?这时候需要对文档做一个处理。

chunking:

对文字进行切块。分块是将长文档分割为语义连贯的小片段(Chunk)的过程,目的是适配大模型的上下文限制,同时保留内容关联性。分块质量直接影响后续检索的准确性和生成的连贯性。

embedding:

将每段文字转化成向量。嵌入是将文本转化为高维向量(Embedding)的过程,使计算机能够通过数学运算(如余弦相似度)量化文本间的语义关联。向量数据库存储这些向量后,可实现高效的语义检索。

提出问题时使用相同的embedding模型将问题向量化,找到数据库中最相近的来返回。

流程总结

rag存在的问题:

1、语义会分割:比如我是小明。我爱喝饮料。这个句子中我指的是小明,但切分之后我可能就不知道是谁了;

2、缺乏完整性,一个文档返回与问题相关的内容,但是提问"这篇文章出现了几个我"可能就会出现问题。