从0开始学习大模型--Day04--大模型的框架以及基本元素

Agent框架与策略分析

计划与执行(planning-and-Execute)

该框架侧重于先规划一系列的行动,然后执行。这个框架可以使大模型能够先综合考虑任务的多个方面,然后按照计划进行行动,比较适合应用在较复杂的项目管理中或者需要多步决策的场景下。

计划与执行的逻辑图

自问自答(Self-Ask)

该框架允许大模型对自己提出问题并回答,来增强对问题的理解,从而提高其给出的回答的质量,其比较适合在需要深入分析或提供创造性解决方案时是用,比如创作小说,设计艺术品的外观,解决房屋的装修规划等等。

具体过程就如字面意思一般,在向大模型提出问题后,其不仅会给出答案,还会在后续反问自己相关的问题,从而进一步地确定其答案的有效性。

思考并自我反思(Thinking and Self-Reflection)

该框架主要用于模拟和实现复杂的决策过程,通过不断自我评估和调整,是系统能够学习并改进决策过程,从而在面对复杂问题时,回答能够表现得更好。

与传统的一边思考一边行动不同,在每次思考并给出行动后,都会对其进行评估并传回LLM形成反馈,从而确保思考与行动的方向没有偏离解决问题的道路,不然很可能会出现像你画我猜游戏中的,开头是想画一只猫,最后却变成了一只狗。

ReAct框架

该框架首先会基于原有的知去思考,并审视现有的工具判断是否有帮助。当发现已有的知识不足以回答这个问题时,便会自发地去调动工具去尝试从别的渠道获取其他信息,基于新的信息重复进行推理和行动,直到完成这个任务。

ReAct框架与仅推理和仅行动的思考过程的区别

提示词与参数量

在大模型的使用过程中,我们经常会发现得不到想要的回答,他们的思考方式与我们总是不在一个频道上,这个时候,提示词的作用就是能让我们让大模型的思考方向跟我们在同一条路上,我们可以通过给大模型不同的应用场景,不同的范围提示,从而起到对其掌握的海量的数据清洗,筛选的作用。此外,还有一个关键的知识是要掌握的,就是上面提到的海量的数据,这是大模型生成回答的根本,就跟我们学习一个数学是一个循序渐进的过程,前面的学习为后面打下基础,这些就叫做参数量。

学习来源于B站教程:【基础篇】01.提示词,提示词工程是什么?(简单普及)_哔哩哔哩_bilibili

相关推荐
黎宇幻生1 小时前
Java全栈学习笔记39
java·笔记·学习
诸葛悠闲3 小时前
XCP协议在以太网上实现的配置
学习
遇印记4 小时前
大二java学习笔记:二维数组
java·笔记·学习
爱吃甜品的糯米团子5 小时前
Linux 学习笔记之进程管理、网络基础与常用软件安装
linux·网络·学习
Purple Coder6 小时前
面试-上海电力大学研一的学习经验
学习
饮浊酒7 小时前
Python学习-----小游戏之人生重开模拟器(普通版)
python·学习·游戏程序
QT 小鲜肉7 小时前
【个人成长笔记】在Ubuntu中的Linux系统安装 anaconda 及其相关终端命令行
linux·笔记·深度学习·学习·ubuntu·学习方法
QT 小鲜肉7 小时前
【个人成长笔记】在Ubuntu中的Linux系统安装实验室WIFI驱动安装(Driver for Linux RTL8188GU)
linux·笔记·学习·ubuntu·学习方法
急急黄豆8 小时前
MADDPG学习笔记
笔记·学习
BullSmall8 小时前
《道德经》第十七章
学习