从0开始学习大模型--Day04--大模型的框架以及基本元素

Agent框架与策略分析

计划与执行(planning-and-Execute)

该框架侧重于先规划一系列的行动,然后执行。这个框架可以使大模型能够先综合考虑任务的多个方面,然后按照计划进行行动,比较适合应用在较复杂的项目管理中或者需要多步决策的场景下。

计划与执行的逻辑图

自问自答(Self-Ask)

该框架允许大模型对自己提出问题并回答,来增强对问题的理解,从而提高其给出的回答的质量,其比较适合在需要深入分析或提供创造性解决方案时是用,比如创作小说,设计艺术品的外观,解决房屋的装修规划等等。

具体过程就如字面意思一般,在向大模型提出问题后,其不仅会给出答案,还会在后续反问自己相关的问题,从而进一步地确定其答案的有效性。

思考并自我反思(Thinking and Self-Reflection)

该框架主要用于模拟和实现复杂的决策过程,通过不断自我评估和调整,是系统能够学习并改进决策过程,从而在面对复杂问题时,回答能够表现得更好。

与传统的一边思考一边行动不同,在每次思考并给出行动后,都会对其进行评估并传回LLM形成反馈,从而确保思考与行动的方向没有偏离解决问题的道路,不然很可能会出现像你画我猜游戏中的,开头是想画一只猫,最后却变成了一只狗。

ReAct框架

该框架首先会基于原有的知去思考,并审视现有的工具判断是否有帮助。当发现已有的知识不足以回答这个问题时,便会自发地去调动工具去尝试从别的渠道获取其他信息,基于新的信息重复进行推理和行动,直到完成这个任务。

ReAct框架与仅推理和仅行动的思考过程的区别

提示词与参数量

在大模型的使用过程中,我们经常会发现得不到想要的回答,他们的思考方式与我们总是不在一个频道上,这个时候,提示词的作用就是能让我们让大模型的思考方向跟我们在同一条路上,我们可以通过给大模型不同的应用场景,不同的范围提示,从而起到对其掌握的海量的数据清洗,筛选的作用。此外,还有一个关键的知识是要掌握的,就是上面提到的海量的数据,这是大模型生成回答的根本,就跟我们学习一个数学是一个循序渐进的过程,前面的学习为后面打下基础,这些就叫做参数量。

学习来源于B站教程:【基础篇】01.提示词,提示词工程是什么?(简单普及)_哔哩哔哩_bilibili

相关推荐
西岸行者5 天前
学习笔记:SKILLS 能帮助更好的vibe coding
笔记·学习
悠哉悠哉愿意5 天前
【单片机学习笔记】串口、超声波、NE555的同时使用
笔记·单片机·学习
别催小唐敲代码5 天前
嵌入式学习路线
学习
毛小茛5 天前
计算机系统概论——校验码
学习
babe小鑫5 天前
大专经济信息管理专业学习数据分析的必要性
学习·数据挖掘·数据分析
winfreedoms5 天前
ROS2知识大白话
笔记·学习·ros2
在这habit之下5 天前
Linux Virtual Server(LVS)学习总结
linux·学习·lvs
我想我不够好。5 天前
2026.2.25监控学习
学习
im_AMBER5 天前
Leetcode 127 删除有序数组中的重复项 | 删除有序数组中的重复项 II
数据结构·学习·算法·leetcode
CodeJourney_J5 天前
从“Hello World“ 开始 C++
c语言·c++·学习