Hello-Agents 第一部分总结:从智能体概念到大语言模型基础

作者: 逆境不可逃

技术永无止境

希望我的内容可以帮助到你!!!!!


大家吼 ! 我是逆境不可逃 今天给大家带来文章《Hello-Agents 第一部分总结:从智能体概念到大语言模型基础》.

Hello-Agents 官方地址:datawhalechina/hello-agents: 📚 《从零开始构建智能体》------从零开始的智能体原理与实践教程

摘要

《Hello-Agents》第一部分是全书学习的认知基础,依次讲解智能体定义、发展历程、大语言模型底层原理。整体梳理出现代智能体是多种人工智能技术融合发展的产物,文章整合前三章内容,梳理智能体核心运行逻辑、技术演进路线、LLM 模型架构,同时讲解大模型交互使用技巧、模型选型要点,重点分析大模型幻觉等原生缺陷与解决思路,为后续智能体实战开发打下理论根基。

一、智能体的本质:能感知、会决策、可行动

智能体核心循环图

智能体(Agent)是一类可以感知外部环境、依托既定目标自主思考决策,并且执行动作改变环境的智能系统,区别于固定流程脚本与普通对话机器人,具备完整闭环运行能力。

智能体包含四大基础组成:环境、感知、行动、自主性。 其核心运行循环为:感知 -> 思考 -> 行动 -> 观察 -> 再思考 在大模型智能体中,该循环标准化为 Thought-Action-Observation 运行范式,依靠循环推理将模糊任务拆解为可执行步骤。

同时文章区分两大自动化模式:Workflow 属于固定预设流程,适配规则简单、路径固定的任务;Agent 属于目标驱动模式,适配复杂多变、需要自主推理调整的开放型任务。

Workflow 与 Agent 对比图

二、从符号主义到现代智能体:历史不是直线,而是融合

AI 智能体发展史时间线插画

符号主义VS联结主义

现代智能体并非全新技术,整合了数十年人工智能各大流派核心思想。 早期人工智能以符号主义为主,依靠人工编写逻辑规则搭建专家系统,通过知识库与推理机完成逻辑判断,能够实现简单指令执行与任务规划。

但符号主义存在明显短板,人工编写知识成本高、无法适配常识场景、面对未知场景极易失效,系统灵活性极差。

后续人工智能逐步转向学习范式,联结主义依靠神经网络自主学习数据特征,强化学习依托环境交互优化决策策略,大规模预训练模型积累海量知识与语言逻辑。

如今主流 LLM 智能体融合多类技术优势,继承符号主义推理规划能力、神经网络学习能力、强化学习交互决策能力,结合大模型通用理解能力,形成完整成熟的智能体技术体系。

三、为什么大语言模型能成为智能体的大脑

Transformer 注意力机制的技术插画

大语言模型是智能体的核心认知中枢,语言模型经历多轮技术迭代。 从早期依靠统计概率预测文字的 N-gram 模型,到引入词向量、具备记忆能力的 RNN、LSTM 网络,最终Transformer 架构成为大模型主流底层结构。

Transformer 依靠自注意力机制、多头注意力、残差连接等核心组件,摆脱串行文本处理限制,支持大规模并行训练,拥有超强上下文语义理解能力。

当下主流 GPT 系列采用 Decoder-Only 架构,以自回归方式逐一生成文本,结构简洁易扩展,天然适配对话交互、逻辑推理、内容生成等场景,满足智能体思考决策的核心需求。

Decoder-Only 大语言模型自回归生成过程的技术插画

四、与大模型交互:提示、分词、部署与选型

用户提示词引导 LLM 智能体调用工具

想要落地搭建智能体,需要熟练掌握大模型交互使用方法。 提示工程是引导模型行为的核心手段,包含角色设定、零样本提示、少样本示例提示、思维链提示等常用写法,适配不同业务场景。

AI 智能体选择大语言模型的技术决策图

温度值、Top-k 等采样参数,可灵活调控模型输出风格,严谨业务选用低随机性参数,创意场景可适当放宽限制。

日常开发中需要重视 Token 分词规则,分词方式直接影响上下文长度、调用成本与模型输出效果。 模型使用分为闭源 API 调用与本地开源模型部署,闭源模型能力强易上手,开源模型隐私性高、定制化灵活,开发者需结合成本、延迟、业务需求合理选型。

大语言模型分词过程

五、缩放法则与幻觉:能力越强,越需要边界意识

降低大语言模型幻觉的概念技术图

大模型性能提升遵循缩放法则,合理配比参数量、训练数据与计算资源,模型规模突破临界值后会涌现上下文学习、复杂推理等超强能力,这也是大模型驱动智能体的核心条件。

大模型存在无法规避的幻觉问题,模型仅预测高概率文本,容易输出虚假错误信息,在智能体场景中极易引发错误决策与错误工具调用。

主流解决办法:接入 RAG 检索知识库、调用外部工具核验信息、增加多轮自我校验、严格限制自主执行权限,通过外部约束弥补大模型原生缺陷,保障智能体运行稳定可靠。

六、第一部分的整体脉络

第一部分整体形成完整理论学习闭环,先明确智能体基础定义与运行逻辑,再追溯智能体技术发展历史,理清各大 AI 流派技术渊源,最后深入讲解大语言模型底层架构、使用方法与现存缺陷。

整体核心主旨:现代智能体以大语言模型作为认知核心,依靠工具调用、环境反馈完成自主行动,融合传统人工智能所有优势形成自主解决问题的智能系统。

本部分全部理论内容,是后续学习智能体框架、记忆检索、多智能体协作、项目实战开发的必备基础,只有吃透底层原理,才能脱离简单调用接口,完成高质量智能体项目开发。

相关推荐
硅谷秋水9 小时前
世界模型:架构、方法、推理与应用的综述(上)
人工智能·机器学习·计算机视觉·语言模型
隔窗听雨眠9 小时前
AI有没有自我意识
人工智能
春风野草9 小时前
第五章 记忆系统不是假装记住——3层记忆架构的坑与遗忘的艺术
人工智能·ai编程
ylscode9 小时前
谷歌发布 Gemma 4 12B:面向消费硬件的民主多模态人工智能
人工智能
人工智能培训10 小时前
打造行业知识图谱三步走
大数据·人工智能·机器学习·3d·知识图谱·agent
DolphinDB智臾科技10 小时前
Starfish 研报分析与因子衍生 | 上传一份研报,让 AI 跑完因子全流程
人工智能
zhangfeng113310 小时前
2021-2026 年全球 传统厂家AI 算力卡 GPU 前沿技术研究报告
人工智能·深度学习·语言模型·gpu算力·芯片
3DVisionary10 小时前
aero-engine-blade-thermal-fatigue-dic-inspection
人工智能·算法·机器学习·航空发动机·高温dic·涡轮叶片·热疲劳
逻辑君10 小时前
神经生物学研究【20260001】
人工智能·数学建模
PKUMOD10 小时前
ACL2026 | 通过语义级内推理图谱进行RAG系统的幻觉检测
人工智能