一、智能体(Agent)

啥叫智能体?简单说,就是能自己干活、奔着目标去完成任务的 AI 实体。你就把它当成一个超省心的小跟班,你说啥它就干啥。比如你让它查明天天气,它马上给你安排得清清楚楚。
举个例子,AI 面试官就是一个很典型的智能体。它能根据招聘要求,自己给候选人发面试邀请,自己做视频面试,自己写面试评价,自己发 offer,最后还能把招聘统计报表直接发给你。
是不是巨省事?当然,智能体现在也有不少毛病,尤其是在对准确度要求特别高的场景里,完全自主的智能体还会有很明显的幻觉问题。
比如某大厂出的DataAgent,你只要说一句话,它就能查数据库,还能做出很高级的图表。但你仔细一看就会发现问题不少,比如数据出错、甚至直接编数据。这种时候,我们就得用 RAG、微调这些方法,来减少智能体的幻觉问题。
二、多智能体系统(Multi-Agent System)

多智能体系统,其实就是把好几个智能体放在一起,让它们互相配合、一起干活,就像一个分工明确的小团队,每个人都有自己的任务,互相搭把手把事情做好。
举个例子,在智能交通里,路口的智能体专门负责收集车流量和路况信息,再把这些数据传给控制中心的智能体。控制中心的智能体分析完之后,就把红绿灯的时间调整到最合适的状态,车流马上就变得顺畅多了。
和单个智能体比起来,多智能体系统的要求会更高。比如说,要是其中一个智能体出问题、卡住不动了,整个系统都可能跟着瘫痪。想解决这个问题也很简单,可以给每个智能体都准备一个"备用克隆体",一旦某个智能体死机了,备用的马上就能顶上继续工作。
三、RAG(Retrieval-Augmented Generation)

RAG的本质,其实就是先从指定的外部知识库里面,把相关信息检索出来,再用这些信息去生成回答。因为这些信息都是来自企业自己的知识库,不是AI随便瞎编出来的,所以会更准确、更靠谱。
可以这么理解,RAG就像是给智能体配上了一个超强的专属知识库。当智能体碰到比较复杂的问题时,它会先在这个知识库里快速查找资料,把相关内容都找齐之后,再用自己的话整理成一段完整通顺的回答。
举个例子,在智能客服系统里,RAG就特别关键。如果顾客问一些比较细致的问题,比如产品具体怎么使用,智能客服就会通过RAG,在知识库里快速找到答案,然后生成一段详细又准确的回复发给顾客。
当然,RAG本身也有不少难点。比如说,知识库的内容一定要做好分类、分等级,避免内容互相矛盾,同时还要及时更新,不然就会出现"进去的是垃圾信息,出来的也还是垃圾信息"的情况。
四、工作流(Work Flow)

所谓工作流,就是一连串互相关联的任务和步骤,按照固定顺序一步步执行,最终达成某个具体的业务目标。工作流就像一条流水线,把复杂的任务拆成一个个小步骤,每个步骤都由专门的工人,也就是智能体组件来负责。
第一个工人做完,把结果交给第二个,第二个接着往下做,直到整个任务全部完成。这样分工清晰,不管是质量还是效果都会更稳定。在对准确性要求特别高的场景里,如果让智能体自己去规划执行步骤,反而容易出现幻觉问题。
这时候我们就可以用工作流,把智能体的执行步骤固定下来,以此减少幻觉。举个例子,在订单处理智能体里,员工录入完订单信息后,工作流会自动触发库存检查。
库存足够,智能体就直接安排发货;库存不够,智能体就创建补货任务,同时通知采购部门。另外,智能体还会给客户发消息,告知大概的发货时间。
当然,工作流也不是万能的。如果工作流设计得不合理,比如步骤太多、顺序不对,任务处理速度就会变慢。所以,还需要专业的产品经理来梳理和优化。
五、微调(Fine-Tuning)

所谓的微调,其实可以简单理解成,用一部分行业或者企业自己的数据,再去训练大模型,让模型更懂这个行业、更懂企业的具体业务。
比如说,很多行业都有一大堆专业术语,甚至是 "行业黑话",标准的大模型根本不懂这些词,自然也就给不出准确的回答。那基于这个标准大模型做出来的智能体,肯定也没法把业务做好。
这时候,我们就可以用微调,来提升智能体对行业的理解能力。
举个例子,通用的质量检测模型,在处理企业自家产品数据的时候,检测准确率往往不高。
于是企业就收集了大量生产线上的产品图片数据,有合格品也有次品,还把这些数据做好了标注。接着用这些数据去对质量检测模型做微调,最后检测准确率直接提升了 25%。
当然了,微调也不是万能的,比如它对数据的依赖特别高,成本也不低。通常来说,用来做微调的数据,都需要专业的标注人员来完成标注。
六、函数调用(Function Calling)

虽然这么说不算特别严谨,但我们可以把 "函数" 简单理解成 "API"。
当我们有好几个软件程序,就可以对应写好多个 "函数",也就是 API。这样一来,智能体想用某个功能的时候,直接去 "调用" 这个函数就行。
举个例子,有个函数专门用来算两个数相加,智能体想算 1+1,直接调用这个函数,马上就能算出 2,不用再重新写一遍求和的程序。
再比如在图像处理系统里,智能体要处理一张照片,就需要调用好多个函数。先调用边缘检测函数,把照片里物体的轮廓描出来;再调用特征提取函数,分析物体的形状和纹理。就这样一步步处理下来,智能体就能认出照片里的东西。
函数调用虽然很好用,但也存在不少问题。
比如说,不同大模型之间的 "函数调用" 标准不一样,为了适配多个大模型,往往需要写多套不同的函数。
而 MCP 就可以很好地解决这个问题。
七、MCP(Model Context Protocol)

MCP 是一种让 AI 智能体和外部软件能顺畅协作的开放标准协议。有了 MCP,软件只要按照这个标准做一套通用接口,就能被多个模型直接调用。
打个比方,生活智能体通过 MCP 接入了各种软件工具,你跟它说"点一杯咖啡",它就会自动调用外卖软件下单;你问它"今天天气怎么样",它就会自动调用天气工具帮你查询。
不过 MCP 也不是十全十美的,如果大家都只跟着某一家大厂的 MCP 标准走,很可能会形成类似"苹果税"那样的新垄断。
八、A2A(Agent-to-Agent Protocol)

A2A(Agent-to-Agent Protocol)是谷歌推出的一项开源通信协议,主要是给不同框架做出来的AI智能体,提供一套标准化的协作方式,让它们能打破技术壁垒,互相配合完成复杂的任务。
简单说,MCP解决的是智能体和外部软件之间的协作问题;而A2A解决的,就是智能体和智能体之间的协作问题。
举个例子,影像分析智能体和病历信息综合智能体,就可以通过A2A协议互相沟通:
影像智能体把识别到的病变特征发给病历智能体,病历智能体再把相关的病历信息发回去,两边一配合,诊断报告就能生成得又快又准。
好了,8个核心概念就讲完了,你学会了没?