Hello-Agents 第一部分总结:从智能体概念到大语言模型基础

作者: 逆境不可逃

技术永无止境

希望我的内容可以帮助到你!!!!!


大家吼 ! 我是逆境不可逃 今天给大家带来文章《Hello-Agents 第一部分总结:从智能体概念到大语言模型基础》.

Hello-Agents 官方地址:datawhalechina/hello-agents: 📚 《从零开始构建智能体》------从零开始的智能体原理与实践教程

摘要

《Hello-Agents》第一部分是全书学习的认知基础,依次讲解智能体定义、发展历程、大语言模型底层原理。整体梳理出现代智能体是多种人工智能技术融合发展的产物,文章整合前三章内容,梳理智能体核心运行逻辑、技术演进路线、LLM 模型架构,同时讲解大模型交互使用技巧、模型选型要点,重点分析大模型幻觉等原生缺陷与解决思路,为后续智能体实战开发打下理论根基。

一、智能体的本质:能感知、会决策、可行动

智能体核心循环图

智能体(Agent)是一类可以感知外部环境、依托既定目标自主思考决策,并且执行动作改变环境的智能系统,区别于固定流程脚本与普通对话机器人,具备完整闭环运行能力。

智能体包含四大基础组成:环境、感知、行动、自主性。 其核心运行循环为:感知 -> 思考 -> 行动 -> 观察 -> 再思考 在大模型智能体中,该循环标准化为 Thought-Action-Observation 运行范式,依靠循环推理将模糊任务拆解为可执行步骤。

同时文章区分两大自动化模式:Workflow 属于固定预设流程,适配规则简单、路径固定的任务;Agent 属于目标驱动模式,适配复杂多变、需要自主推理调整的开放型任务。

Workflow 与 Agent 对比图

二、从符号主义到现代智能体:历史不是直线,而是融合

AI 智能体发展史时间线插画

符号主义VS联结主义

现代智能体并非全新技术,整合了数十年人工智能各大流派核心思想。 早期人工智能以符号主义为主,依靠人工编写逻辑规则搭建专家系统,通过知识库与推理机完成逻辑判断,能够实现简单指令执行与任务规划。

但符号主义存在明显短板,人工编写知识成本高、无法适配常识场景、面对未知场景极易失效,系统灵活性极差。

后续人工智能逐步转向学习范式,联结主义依靠神经网络自主学习数据特征,强化学习依托环境交互优化决策策略,大规模预训练模型积累海量知识与语言逻辑。

如今主流 LLM 智能体融合多类技术优势,继承符号主义推理规划能力、神经网络学习能力、强化学习交互决策能力,结合大模型通用理解能力,形成完整成熟的智能体技术体系。

三、为什么大语言模型能成为智能体的大脑

Transformer 注意力机制的技术插画

大语言模型是智能体的核心认知中枢,语言模型经历多轮技术迭代。 从早期依靠统计概率预测文字的 N-gram 模型,到引入词向量、具备记忆能力的 RNN、LSTM 网络,最终Transformer 架构成为大模型主流底层结构。

Transformer 依靠自注意力机制、多头注意力、残差连接等核心组件,摆脱串行文本处理限制,支持大规模并行训练,拥有超强上下文语义理解能力。

当下主流 GPT 系列采用 Decoder-Only 架构,以自回归方式逐一生成文本,结构简洁易扩展,天然适配对话交互、逻辑推理、内容生成等场景,满足智能体思考决策的核心需求。

Decoder-Only 大语言模型自回归生成过程的技术插画

四、与大模型交互:提示、分词、部署与选型

用户提示词引导 LLM 智能体调用工具

想要落地搭建智能体,需要熟练掌握大模型交互使用方法。 提示工程是引导模型行为的核心手段,包含角色设定、零样本提示、少样本示例提示、思维链提示等常用写法,适配不同业务场景。

AI 智能体选择大语言模型的技术决策图

温度值、Top-k 等采样参数,可灵活调控模型输出风格,严谨业务选用低随机性参数,创意场景可适当放宽限制。

日常开发中需要重视 Token 分词规则,分词方式直接影响上下文长度、调用成本与模型输出效果。 模型使用分为闭源 API 调用与本地开源模型部署,闭源模型能力强易上手,开源模型隐私性高、定制化灵活,开发者需结合成本、延迟、业务需求合理选型。

大语言模型分词过程

五、缩放法则与幻觉:能力越强,越需要边界意识

降低大语言模型幻觉的概念技术图

大模型性能提升遵循缩放法则,合理配比参数量、训练数据与计算资源,模型规模突破临界值后会涌现上下文学习、复杂推理等超强能力,这也是大模型驱动智能体的核心条件。

大模型存在无法规避的幻觉问题,模型仅预测高概率文本,容易输出虚假错误信息,在智能体场景中极易引发错误决策与错误工具调用。

主流解决办法:接入 RAG 检索知识库、调用外部工具核验信息、增加多轮自我校验、严格限制自主执行权限,通过外部约束弥补大模型原生缺陷,保障智能体运行稳定可靠。

六、第一部分的整体脉络

第一部分整体形成完整理论学习闭环,先明确智能体基础定义与运行逻辑,再追溯智能体技术发展历史,理清各大 AI 流派技术渊源,最后深入讲解大语言模型底层架构、使用方法与现存缺陷。

整体核心主旨:现代智能体以大语言模型作为认知核心,依靠工具调用、环境反馈完成自主行动,融合传统人工智能所有优势形成自主解决问题的智能系统。

本部分全部理论内容,是后续学习智能体框架、记忆检索、多智能体协作、项目实战开发的必备基础,只有吃透底层原理,才能脱离简单调用接口,完成高质量智能体项目开发。

相关推荐
Shockang13 小时前
AI 设计工作流全景拆解:Figma MCP / Claude Design / Codex / Google Stitch
人工智能
To_OC15 小时前
数据集划分不是随便切:手把手切分大众点评情感数据集
人工智能·llm·agent
冬奇Lab15 小时前
每日一个开源项目(第142篇):android/skills - Google 官方 Android 开发 AI Skill 库
人工智能·开源·资讯
冬奇Lab15 小时前
Skill 系列(06):Skill 工程化与治理——路由准确率 38%、压缩节省 76%
人工智能·开源·agent
IT_陈寒17 小时前
Vue这个坑我跳了两次,原来问题出在这
前端·人工智能·后端
新新技术迷18 小时前
Node给AI接口做SSE代理与鉴权
人工智能
redreamSo19 小时前
大模型是不是到顶了?瓶颈到底在哪
人工智能·openai
Oo92019 小时前
Tool Use 背后的技术逻辑
人工智能
姗姗来迟了19 小时前
Vue3封装AI流式对话组件踩坑实录
人工智能