AI 系统架构的演进:LLM → RAG → AI Workflow → AI Agent

编者按: 当前 AI 系统建设中的一大痛点是:盲目追求先进技术而忽视业务实际需求,导致系统过度复杂、成本高昂、可靠性差。许多团队在 Agent 热潮中迷失方向,不知道何时该用简单的 LLM,何时需要 RAG,什么场景下才真正需要智能体。

文章通过简历筛选这一典型应用场景,系统阐述了 AI 系统发展的四个核心阶段:从最基础的纯 LLM 架构,到增强检索能力的 RAG 系统,再到具备工具调用能力的 AI 工作流,最终发展为具有自主决策能力的 AI Agent。作者特别强调,每个架构层级都有其适用场景和技术边界 ------ 简单的分类任务可能只需要基础的提示词工程,而复杂的端到端业务流程才需要 Agent 的自主规划能力。我们在追求功能丰富性的同时,必须优先考虑系统的可靠性和稳定性。

作者 | codelink

编译 | 岳

AI Agent 是当前的一个热门话题,但并非所有 AI 系统都需要采用这种架构。

虽然 Agent 具有自主决策能力,但更简单、更具成本效益的解决方案往往更适合实际业务场景。关键在于根据具体需求选择恰当的架构方案。

本文将探讨大语言模型(LLMs)的最新进展,并解析 AI 系统的核心设计理念。

我们实践过从不包含示例的提示词技术(zero-shot prompting)到思维链推理,从基于 RAG 的架构到复杂工作流及 autonomous agents 等不同复杂度的 LLM 项目。

这个新兴领域的术语体系仍在演进,不同概念之间的边界尚未界定,分类标准仍不固定。随着该领域的发展,新的框架和工程实践不断涌现,推动构建更可靠的 AI 系统。

为直观展示不同系统的差异,我们将通过简历筛选这个典型案例,揭示不同架构层级在能力和系统复杂度上的非线性跃升。

01 纯 LLM 架构

纯 LLM 本质上是互联网信息的有损压缩包,是从其训练数据中提取的知识快照。 它尤其擅长处理依赖其参数化知识(即训练阶段内化的信息)的任务,典型场景包括:总结小说内容、撰写关于全球变暖的论述、用 5 岁儿童能理解的语言解释狭义相对论、或者创作俳句(译者注:日本有一种特定格式的诗歌,叫做"俳(pái)句",在形式上堪称世界文学中最短的格律诗。)。

但若没有额外的功能扩展,LLM 无法提供实时信息(例如纽约的当前气温)。这正是纯 LLM 与 ChatGPT 等对话式应用的区别 ------ 后者通过实时搜索和其他工具增强了核心 LLM 的能力。

不过,并非所有功能增强都需要外部上下文。通过提示词工程(如上下文学习、小样本学习等技术),LLM 无需检索外部信息也能处理特定问题。

应用示例:

只需采用使用单个示例的提示词技术(one-shot prompting)结合上下文学习,就能让 LLM 根据职位描述对简历进行「通过/不通过」的二分类判断。

02 RAG(检索增强生成)

检索方法通过提供相关上下文来增强 LLM 的能力,使其输出更具时效性、精确性和实用性。 借助这一技术,可以让 LLM 访问并处理内部数据。这些上下文信息使 LLM 能够提取信息、生成摘要并生成响应。RAG 还能通过实时数据检索获取最新信息。

应用示例:

在简历筛选场景中,通过检索公司的内部数据(如工程操作手册、招聘政策及历史简历资料)来丰富上下文信息,从而做出更准确的分类判断。

检索过程通常需要借助向量化工具、向量数据库和语义搜索等技术实现。

03 工具调用(Tool Use)与 AI 工作流(AI Workflow)

LLM 能够通过定义明确的路径实现业务流程自动化,这类系统最适合处理结构清晰、标准统一的任务。

通过使用工具调用(Tool use)可以实现工作流自动化。通过对接各类 API(包括计算器、日历、邮件服务或搜索引擎等),LLM 可以利用可靠的外部工具,而非依赖其存在非确定性的原生能力。

应用示例:

这个 AI 工作流可以连接招聘门户获取简历和职位描述 → 根据经验、学历和技能评估投递简历者的资质 → 发送相应的邮件回复(拒信或面试邀请)。

要实现这个简历筛选工作流,LLM 需要访问数据库、邮件 API 和日历 API,并按照预设步骤以编程方式实现全流程自动化。

04 AI Agent

AI Agent 是具备自主推理能力和决策能力的系统。 它们能够:将任务分解为多个步骤、根据需要调用外部工具、评估执行结果、并自主决定后续动作(存储执行结果/请求人工干预/继续执行下一步)。

这代表着在工具调用和 AI 工作流之上的又一层抽象,实现了规划和决策的自动化。

与 AI 工作流需要明确的用户触发器(如按钮点击)且必须遵循预设路径不同,AI Agent 可以自主启动工作流,并动态决定各环节的执行顺序和组合方式。

应用示例:

AI Agent 可以管理完整的招聘流程,包括:解析简历、通过聊天或邮件协调面试时间、安排面试会议、以及处理日程变更等。

这项综合性任务要求 LLM 具备以下访问权限:数据库、邮件和日历 API,以及聊天和通知系统。

05 核心要点

1)并非所有系统都需要 AI Agent

应从简单、可组合的模式入手,按需逐步增加复杂度。某些场景仅需检索功能即可满足需求。 以简历筛选为例,当筛选标准和后续操作明确时,基础工作流就能胜任。仅当需要更大的自主性以减少人工干预时,才应考虑采用 Agent 方案。

2)注重可靠性而非丰富的功能

LLM 的非确定性特质使得构建可靠系统颇具挑战。虽然快速验证概念(proofs of concept)可行,但将其扩展到生产环境时往往暴露各种问题。 建议从沙盒环境起步,实施统一的测试方法,并通过防护机制确保系统可靠性。

END

本期互动内容 🍻

❓ 您认为 AI Agent 的自主决策权应该设限吗?举例说明边界。(例如:向用户发送拒信是否需要人工复核?)

本文经原作者授权,由 Baihai IDP 编译。如需转载译文,请联系获取授权。

原文链接:

www.codelink.io/blog/post/a...

相关推荐
仗剑_走天涯22 分钟前
基于pytorch.nn模块实现线性模型
人工智能·pytorch·python·深度学习
cnbestec1 小时前
协作机器人UR7e与UR12e:轻量化设计与高负载能力助力“小而美”智造升级
人工智能·机器人·协作机器人·ur协作机器人·ur7e·ur12e
zskj_zhyl1 小时前
毫米波雷达守护银发安全:七彩喜跌倒检测仪重构居家养老防线
人工智能·安全·重构
gaosushexiangji2 小时前
利用sCMOS科学相机测量激光散射强度
大数据·人工智能·数码相机·计算机视觉
ai小鬼头4 小时前
AIStarter新版重磅来袭!永久订阅限时福利抢先看
人工智能·开源·github
墨风如雪4 小时前
万亿参数炸裂!Kimi K2 降临,中国 AI 新时代开启?
aigc
说私域4 小时前
从品牌附庸到自我表达:定制开发开源AI智能名片S2B2C商城小程序赋能下的营销变革
人工智能·小程序
飞哥数智坊5 小时前
新版定价不够用,Cursor如何退回旧版定价
人工智能·cursor
12点一刻5 小时前
搭建自动化工作流:探寻解放双手的有效方案(2)
运维·人工智能·自动化·deepseek
未来之窗软件服务5 小时前
东方仙盟AI数据中间件使用教程:开启数据交互与自动化应用新时代——仙盟创梦IDE
运维·人工智能·自动化·仙盟创梦ide·东方仙盟·阿雪技术观