目录
1、Agent
在人工智能(AI)和计算机科学领域,Agent(智能体) 是指具备自主感知环境、分析信息、制定决策并执行任务能力的软件实体或系统。它并非简单的 "程序",核心特点是能根据外部环境变化和预设目标,主动调整行为,而非仅被动响应指令。
把在工具、模型、用户之间传话的工具交agent。ai可以通过agent获取工具的信息(查文件,读文件)并执行操作。
工具相关的信息统一格式放在Function calling中(也可能放在systempromrt中)

2、MCP
一个通讯协议,规定了aiagent和工具之间的通信(格式参数等等)
3、Prompt
在人工智能领域中,"prompt" 是指向模型提供输入以引导其生成特定输出的文本或指令。它是与模型进行交互时用户提供的文本段落,用于描述用户想要从模型获取的信息、回答、文本等内容。Prompt 的目的是引导模型产生所需的回应,以便更好地控制生成的输出。
可以分为两类:
user Prompt 用户提示词:用户说的话。
systempromrt系统提示词:描述ai的性格角色背景信息语气等。
流程总结:

1、使用agent,输入用户提示词。
2、agent通过mcp协议获取工具。
3、agent将工具和用户提示词放在一起给到ai模型。
4、ai大模型发现工具,产生调用工具的请求。
5、agent使用工具。
6、将结果返回给ai大模型。
7、ai大模型分析出结果并返回。
视频来源:10分钟讲清楚 Prompt, Agent, MCP 是什么哔哩哔哩bilibili
RAG
什么是ai的幻读?你有一个独特的文档,你想问ai有关这个文档的问题,但是由于ai并没有这个文档,此时ai返回的答案可能与你的文档并没有关系。 这时就需要你把文档一起发送给ai大模型,这样就会返回正确的答案了。但是由于你的文档很大不能一次发给ai,这时候就需要找的文档中的相关内容来给到ai。
这个过程就是RAG。Retrieval-Augmented Generation(检索增强生成) ,它是一种结合 "外部知识检索" 与 "大模型生成" 的 AI 技术方案,核心目标是解决大模型的 "知识滞后" 和 "幻觉(生成与事实不符的内容)" 问题,让 AI 能基于特定、最新或私有的知识 生成准确回答。Retrieval-Augmented Generation(检索增强生成) ,它是一种结合 "外部知识检索" 与 "大模型生成" 的 AI 技术方案,核心目标是解决大模型的 "知识滞后" 和 "幻觉(生成与事实不符的内容)" 问题,让 AI 能基于特定、最新或私有的知识生成准确回答。
如何找到文档中相关的内容呢?这时候需要对文档做一个处理。
chunking:
对文字进行切块。分块是将长文档分割为语义连贯的小片段(Chunk)的过程,目的是适配大模型的上下文限制,同时保留内容关联性。分块质量直接影响后续检索的准确性和生成的连贯性。
embedding:
将每段文字转化成向量。嵌入是将文本转化为高维向量(Embedding)的过程,使计算机能够通过数学运算(如余弦相似度)量化文本间的语义关联。向量数据库存储这些向量后,可实现高效的语义检索。
提出问题时使用相同的embedding模型将问题向量化,找到数据库中最相近的来返回。
流程总结

rag存在的问题:
1、语义会分割:比如我是小明。我爱喝饮料。这个句子中我指的是小明,但切分之后我可能就不知道是谁了;
2、缺乏完整性,一个文档返回与问题相关的内容,但是提问"这篇文章出现了几个我"可能就会出现问题。