Hello-Agents 第一部分总结:从智能体概念到大语言模型基础

作者: 逆境不可逃

技术永无止境

希望我的内容可以帮助到你!!!!!


大家吼 ! 我是逆境不可逃 今天给大家带来文章《Hello-Agents 第一部分总结:从智能体概念到大语言模型基础》.

Hello-Agents 官方地址:datawhalechina/hello-agents: 📚 《从零开始构建智能体》------从零开始的智能体原理与实践教程

摘要

《Hello-Agents》第一部分是全书学习的认知基础,依次讲解智能体定义、发展历程、大语言模型底层原理。整体梳理出现代智能体是多种人工智能技术融合发展的产物,文章整合前三章内容,梳理智能体核心运行逻辑、技术演进路线、LLM 模型架构,同时讲解大模型交互使用技巧、模型选型要点,重点分析大模型幻觉等原生缺陷与解决思路,为后续智能体实战开发打下理论根基。

一、智能体的本质:能感知、会决策、可行动

智能体核心循环图

智能体(Agent)是一类可以感知外部环境、依托既定目标自主思考决策,并且执行动作改变环境的智能系统,区别于固定流程脚本与普通对话机器人,具备完整闭环运行能力。

智能体包含四大基础组成:环境、感知、行动、自主性。 其核心运行循环为:感知 -> 思考 -> 行动 -> 观察 -> 再思考 在大模型智能体中,该循环标准化为 Thought-Action-Observation 运行范式,依靠循环推理将模糊任务拆解为可执行步骤。

同时文章区分两大自动化模式:Workflow 属于固定预设流程,适配规则简单、路径固定的任务;Agent 属于目标驱动模式,适配复杂多变、需要自主推理调整的开放型任务。

Workflow 与 Agent 对比图

二、从符号主义到现代智能体:历史不是直线,而是融合

AI 智能体发展史时间线插画

符号主义VS联结主义

现代智能体并非全新技术,整合了数十年人工智能各大流派核心思想。 早期人工智能以符号主义为主,依靠人工编写逻辑规则搭建专家系统,通过知识库与推理机完成逻辑判断,能够实现简单指令执行与任务规划。

但符号主义存在明显短板,人工编写知识成本高、无法适配常识场景、面对未知场景极易失效,系统灵活性极差。

后续人工智能逐步转向学习范式,联结主义依靠神经网络自主学习数据特征,强化学习依托环境交互优化决策策略,大规模预训练模型积累海量知识与语言逻辑。

如今主流 LLM 智能体融合多类技术优势,继承符号主义推理规划能力、神经网络学习能力、强化学习交互决策能力,结合大模型通用理解能力,形成完整成熟的智能体技术体系。

三、为什么大语言模型能成为智能体的大脑

Transformer 注意力机制的技术插画

大语言模型是智能体的核心认知中枢,语言模型经历多轮技术迭代。 从早期依靠统计概率预测文字的 N-gram 模型,到引入词向量、具备记忆能力的 RNN、LSTM 网络,最终Transformer 架构成为大模型主流底层结构。

Transformer 依靠自注意力机制、多头注意力、残差连接等核心组件,摆脱串行文本处理限制,支持大规模并行训练,拥有超强上下文语义理解能力。

当下主流 GPT 系列采用 Decoder-Only 架构,以自回归方式逐一生成文本,结构简洁易扩展,天然适配对话交互、逻辑推理、内容生成等场景,满足智能体思考决策的核心需求。

Decoder-Only 大语言模型自回归生成过程的技术插画

四、与大模型交互:提示、分词、部署与选型

用户提示词引导 LLM 智能体调用工具

想要落地搭建智能体,需要熟练掌握大模型交互使用方法。 提示工程是引导模型行为的核心手段,包含角色设定、零样本提示、少样本示例提示、思维链提示等常用写法,适配不同业务场景。

AI 智能体选择大语言模型的技术决策图

温度值、Top-k 等采样参数,可灵活调控模型输出风格,严谨业务选用低随机性参数,创意场景可适当放宽限制。

日常开发中需要重视 Token 分词规则,分词方式直接影响上下文长度、调用成本与模型输出效果。 模型使用分为闭源 API 调用与本地开源模型部署,闭源模型能力强易上手,开源模型隐私性高、定制化灵活,开发者需结合成本、延迟、业务需求合理选型。

大语言模型分词过程

五、缩放法则与幻觉:能力越强,越需要边界意识

降低大语言模型幻觉的概念技术图

大模型性能提升遵循缩放法则,合理配比参数量、训练数据与计算资源,模型规模突破临界值后会涌现上下文学习、复杂推理等超强能力,这也是大模型驱动智能体的核心条件。

大模型存在无法规避的幻觉问题,模型仅预测高概率文本,容易输出虚假错误信息,在智能体场景中极易引发错误决策与错误工具调用。

主流解决办法:接入 RAG 检索知识库、调用外部工具核验信息、增加多轮自我校验、严格限制自主执行权限,通过外部约束弥补大模型原生缺陷,保障智能体运行稳定可靠。

六、第一部分的整体脉络

第一部分整体形成完整理论学习闭环,先明确智能体基础定义与运行逻辑,再追溯智能体技术发展历史,理清各大 AI 流派技术渊源,最后深入讲解大语言模型底层架构、使用方法与现存缺陷。

整体核心主旨:现代智能体以大语言模型作为认知核心,依靠工具调用、环境反馈完成自主行动,融合传统人工智能所有优势形成自主解决问题的智能系统。

本部分全部理论内容,是后续学习智能体框架、记忆检索、多智能体协作、项目实战开发的必备基础,只有吃透底层原理,才能脱离简单调用接口,完成高质量智能体项目开发。

相关推荐
littlebigbar1 小时前
亲身体验AI智能体在实际项目中展现的核心能力
人工智能·selenium·测试工具
Android出海1 小时前
2026主流AI工具对比:ChatGPT、Gemini、Claude、Grok深度分析与选择
人工智能·ai·chatgpt·claude·grok·ai工具·gemini
霍格沃兹测试学院-小舟畅学1 小时前
AI 测试用例审核 Skill:把用例评审从“凭经验”变成“可评分”
人工智能·测试用例
凌风工具箱1 小时前
告别流量焦虑|凌风工具箱一键开启流量加速,适配 TEMU/Shein/TK 全平台
大数据·人工智能
langzaibeijing1 小时前
性价比高的AI应用厂家
大数据·人工智能·python
NOCSAH1 小时前
统好 AI|长期主义运营,保障智改数转可持续落地
人工智能
andafaAPS1 小时前
安达发|粮食加工行业APS自动排程:开启智造升级的奇幻之旅
大数据·人工智能·安达发aps·车间排产软件·aps自动排程·计划排产软件
AI周红伟1 小时前
DeepSeek V4模型本地部署指南:从环境配置到生产级优化
大数据·人工智能·搜索引擎·copilot·openclaw
Gerardisite1 小时前
企业微信 API 能做什么?
人工智能·python·自动化·企业微信