Hello-Agents 第一部分总结：从智能体概念到大语言模型基础

作者： 逆境不可逃

技术永无止境

希望我的内容可以帮助到你！！！！！

大家吼 ! 我是逆境不可逃今天给大家带来文章《Hello-Agents 第一部分总结：从智能体概念到大语言模型基础》.

Hello-Agents 官方地址:datawhalechina/hello-agents: 📚 《从零开始构建智能体》------从零开始的智能体原理与实践教程

摘要

《Hello-Agents》第一部分是全书学习的认知基础，依次讲解智能体定义、发展历程、大语言模型底层原理。整体梳理出现代智能体是多种人工智能技术融合发展的产物，文章整合前三章内容，梳理智能体核心运行逻辑、技术演进路线、LLM 模型架构，同时讲解大模型交互使用技巧、模型选型要点，重点分析大模型幻觉等原生缺陷与解决思路，为后续智能体实战开发打下理论根基。

一、智能体的本质：能感知、会决策、可行动

智能体核心循环图

智能体（Agent）是一类可以感知外部环境、依托既定目标自主思考决策，并且执行动作改变环境的智能系统，区别于固定流程脚本与普通对话机器人，具备完整闭环运行能力。

智能体包含四大基础组成：环境、感知、行动、自主性。其核心运行循环为：感知 -> 思考 -> 行动 -> 观察 -> 再思考 在大模型智能体中，该循环标准化为 Thought-Action-Observation 运行范式，依靠循环推理将模糊任务拆解为可执行步骤。

同时文章区分两大自动化模式：Workflow 属于固定预设流程，适配规则简单、路径固定的任务；Agent 属于目标驱动模式，适配复杂多变、需要自主推理调整的开放型任务。

Workflow 与 Agent 对比图

二、从符号主义到现代智能体：历史不是直线，而是融合

AI 智能体发展史时间线插画

符号主义VS联结主义

现代智能体并非全新技术，整合了数十年人工智能各大流派核心思想。早期人工智能以符号主义为主，依靠人工编写逻辑规则搭建专家系统，通过知识库与推理机完成逻辑判断，能够实现简单指令执行与任务规划。

但符号主义存在明显短板，人工编写知识成本高、无法适配常识场景、面对未知场景极易失效，系统灵活性极差。

后续人工智能逐步转向学习范式，联结主义依靠神经网络自主学习数据特征，强化学习依托环境交互优化决策策略，大规模预训练模型积累海量知识与语言逻辑。

如今主流 LLM 智能体融合多类技术优势，继承符号主义推理规划能力、神经网络学习能力、强化学习交互决策能力，结合大模型通用理解能力，形成完整成熟的智能体技术体系。

三、为什么大语言模型能成为智能体的大脑

Transformer 注意力机制的技术插画

大语言模型是智能体的核心认知中枢，语言模型经历多轮技术迭代。从早期依靠统计概率预测文字的 N-gram 模型，到引入词向量、具备记忆能力的 RNN、LSTM 网络，最终Transformer 架构成为大模型主流底层结构。

Transformer 依靠自注意力机制、多头注意力、残差连接等核心组件，摆脱串行文本处理限制，支持大规模并行训练，拥有超强上下文语义理解能力。

当下主流 GPT 系列采用 Decoder-Only 架构，以自回归方式逐一生成文本，结构简洁易扩展，天然适配对话交互、逻辑推理、内容生成等场景，满足智能体思考决策的核心需求。

Decoder-Only 大语言模型自回归生成过程的技术插画

四、与大模型交互：提示、分词、部署与选型

用户提示词引导 LLM 智能体调用工具

想要落地搭建智能体，需要熟练掌握大模型交互使用方法。提示工程是引导模型行为的核心手段，包含角色设定、零样本提示、少样本示例提示、思维链提示等常用写法，适配不同业务场景。

AI 智能体选择大语言模型的技术决策图

温度值、Top-k 等采样参数，可灵活调控模型输出风格，严谨业务选用低随机性参数，创意场景可适当放宽限制。

日常开发中需要重视 Token 分词规则，分词方式直接影响上下文长度、调用成本与模型输出效果。模型使用分为闭源 API 调用与本地开源模型部署，闭源模型能力强易上手，开源模型隐私性高、定制化灵活，开发者需结合成本、延迟、业务需求合理选型。

大语言模型分词过程

五、缩放法则与幻觉：能力越强，越需要边界意识

降低大语言模型幻觉的概念技术图

大模型性能提升遵循缩放法则，合理配比参数量、训练数据与计算资源，模型规模突破临界值后会涌现上下文学习、复杂推理等超强能力，这也是大模型驱动智能体的核心条件。

大模型存在无法规避的幻觉问题，模型仅预测高概率文本，容易输出虚假错误信息，在智能体场景中极易引发错误决策与错误工具调用。

主流解决办法：接入 RAG 检索知识库、调用外部工具核验信息、增加多轮自我校验、严格限制自主执行权限，通过外部约束弥补大模型原生缺陷，保障智能体运行稳定可靠。

六、第一部分的整体脉络

第一部分整体形成完整理论学习闭环，先明确智能体基础定义与运行逻辑，再追溯智能体技术发展历史，理清各大 AI 流派技术渊源，最后深入讲解大语言模型底层架构、使用方法与现存缺陷。

整体核心主旨：现代智能体以大语言模型作为认知核心，依靠工具调用、环境反馈完成自主行动，融合传统人工智能所有优势形成自主解决问题的智能系统。

本部分全部理论内容，是后续学习智能体框架、记忆检索、多智能体协作、项目实战开发的必备基础，只有吃透底层原理，才能脱离简单调用接口，完成高质量智能体项目开发。