作者: 逆境不可逃
技术永无止境
希望我的内容可以帮助到你!!!!!
大家吼 ! 我是逆境不可逃 今天给大家带来文章《Hello-Agents 第一部分总结:从智能体概念到大语言模型基础》.
Hello-Agents 官方地址:datawhalechina/hello-agents: 📚 《从零开始构建智能体》------从零开始的智能体原理与实践教程
摘要
《Hello-Agents》第一部分是全书学习的认知基础,依次讲解智能体定义、发展历程、大语言模型底层原理。整体梳理出现代智能体是多种人工智能技术融合发展的产物,文章整合前三章内容,梳理智能体核心运行逻辑、技术演进路线、LLM 模型架构,同时讲解大模型交互使用技巧、模型选型要点,重点分析大模型幻觉等原生缺陷与解决思路,为后续智能体实战开发打下理论根基。
一、智能体的本质:能感知、会决策、可行动

智能体核心循环图
智能体(Agent)是一类可以感知外部环境、依托既定目标自主思考决策,并且执行动作改变环境的智能系统,区别于固定流程脚本与普通对话机器人,具备完整闭环运行能力。
智能体包含四大基础组成:环境、感知、行动、自主性。 其核心运行循环为:感知 -> 思考 -> 行动 -> 观察 -> 再思考 在大模型智能体中,该循环标准化为 Thought-Action-Observation 运行范式,依靠循环推理将模糊任务拆解为可执行步骤。
同时文章区分两大自动化模式:Workflow 属于固定预设流程,适配规则简单、路径固定的任务;Agent 属于目标驱动模式,适配复杂多变、需要自主推理调整的开放型任务。

Workflow 与 Agent 对比图
二、从符号主义到现代智能体:历史不是直线,而是融合

AI 智能体发展史时间线插画 
符号主义VS联结主义
现代智能体并非全新技术,整合了数十年人工智能各大流派核心思想。 早期人工智能以符号主义为主,依靠人工编写逻辑规则搭建专家系统,通过知识库与推理机完成逻辑判断,能够实现简单指令执行与任务规划。
但符号主义存在明显短板,人工编写知识成本高、无法适配常识场景、面对未知场景极易失效,系统灵活性极差。
后续人工智能逐步转向学习范式,联结主义依靠神经网络自主学习数据特征,强化学习依托环境交互优化决策策略,大规模预训练模型积累海量知识与语言逻辑。
如今主流 LLM 智能体融合多类技术优势,继承符号主义推理规划能力、神经网络学习能力、强化学习交互决策能力,结合大模型通用理解能力,形成完整成熟的智能体技术体系。
三、为什么大语言模型能成为智能体的大脑

Transformer 注意力机制的技术插画
大语言模型是智能体的核心认知中枢,语言模型经历多轮技术迭代。 从早期依靠统计概率预测文字的 N-gram 模型,到引入词向量、具备记忆能力的 RNN、LSTM 网络,最终Transformer 架构成为大模型主流底层结构。
Transformer 依靠自注意力机制、多头注意力、残差连接等核心组件,摆脱串行文本处理限制,支持大规模并行训练,拥有超强上下文语义理解能力。
当下主流 GPT 系列采用 Decoder-Only 架构,以自回归方式逐一生成文本,结构简洁易扩展,天然适配对话交互、逻辑推理、内容生成等场景,满足智能体思考决策的核心需求。

Decoder-Only 大语言模型自回归生成过程的技术插画
四、与大模型交互:提示、分词、部署与选型

用户提示词引导 LLM 智能体调用工具
想要落地搭建智能体,需要熟练掌握大模型交互使用方法。 提示工程是引导模型行为的核心手段,包含角色设定、零样本提示、少样本示例提示、思维链提示等常用写法,适配不同业务场景。

AI 智能体选择大语言模型的技术决策图
温度值、Top-k 等采样参数,可灵活调控模型输出风格,严谨业务选用低随机性参数,创意场景可适当放宽限制。
日常开发中需要重视 Token 分词规则,分词方式直接影响上下文长度、调用成本与模型输出效果。 模型使用分为闭源 API 调用与本地开源模型部署,闭源模型能力强易上手,开源模型隐私性高、定制化灵活,开发者需结合成本、延迟、业务需求合理选型。

大语言模型分词过程
五、缩放法则与幻觉:能力越强,越需要边界意识

降低大语言模型幻觉的概念技术图
大模型性能提升遵循缩放法则,合理配比参数量、训练数据与计算资源,模型规模突破临界值后会涌现上下文学习、复杂推理等超强能力,这也是大模型驱动智能体的核心条件。
大模型存在无法规避的幻觉问题,模型仅预测高概率文本,容易输出虚假错误信息,在智能体场景中极易引发错误决策与错误工具调用。
主流解决办法:接入 RAG 检索知识库、调用外部工具核验信息、增加多轮自我校验、严格限制自主执行权限,通过外部约束弥补大模型原生缺陷,保障智能体运行稳定可靠。
六、第一部分的整体脉络
第一部分整体形成完整理论学习闭环,先明确智能体基础定义与运行逻辑,再追溯智能体技术发展历史,理清各大 AI 流派技术渊源,最后深入讲解大语言模型底层架构、使用方法与现存缺陷。
整体核心主旨:现代智能体以大语言模型作为认知核心,依靠工具调用、环境反馈完成自主行动,融合传统人工智能所有优势形成自主解决问题的智能系统。
本部分全部理论内容,是后续学习智能体框架、记忆检索、多智能体协作、项目实战开发的必备基础,只有吃透底层原理,才能脱离简单调用接口,完成高质量智能体项目开发。

