AI时代基础入门

文章目录

基础概念介绍

人工智能概念简介:

复制代码
现在的大模型都是通过深度学习这种算法学习出来的

大模型工作流程

1.分词

对输入的句子进行分词,比如我想去北京, 拆分成【我,想,去,北京】 (分词有不同的拆分策略,比如一个字一个字,或者说根据常用词语等)

拆分出来的单个的词都对应一个token, 每一个token又对应一个token id,这样我们就会得到一个token id列表。

2.根据给定的文本预测下一个token

根据第一步我们得到了一个token列表,第二步其实就是开始生成,根据最大概率原则生成下一个token。再把新生成的token加入到列表中,如此循环往复,这个过程叫做自回归 。直至输出特殊token(如句号对应的token)或者长度达到阈值。

这个概率是怎么预测的呢? 是通过Transformer预测的。

调用大模型参数

temperature(温度):

语义相似度,一般是0-1,当为0的时候,同一个问题的回复的相似度是最高的,也更贴合人类的回复。

为1的时候是最低的,这个时候回复就倾向于不同的结果,会更具有发散性,但并不是很直接准确。

提示词工程

提示词决定了大模型给我们怎样的反馈,答案正确与否, 所以提示词很关键

怎样用提示词?

1.明确目标: 你希望大模型为你做什么

2.对于复杂任务,自己拆分步骤,引导大模型

3.明确上下文,给出自己的背景信息

Agent

Agent是什么

大模型可以接受输入,可以分析&推理,但是缺无法进行规划,思考,无法调用外部工具,资源去解决问题,也无法拥有人类的记忆能力。

AI Agent是基于LLM(大语言模型)的能够自主理解,规划,执行复杂任务的智能体。

更直白的理解就是基于LLM的代理人,本质上还是涌现LLM的能力,Agent的大脑还是LLM.

Agent的设计是为了解决大模型无法直接解决的问题,尤其是这些问题涉及多个任务或者说外部数据的情况。

Agent流程图

Planning(规划) :

智能体会对任务进行拆分 , 并规划任务执行流程,同时对执行过程进行反思和思考,从而决定是否继续执行任务或者是结束任务

Memory(记忆):

分为短期记忆和长期记忆,

长期记忆指的是外部知识库,通常用向量数据库进行检索和搜索。 长期存在

短期记忆指的是一次任务的上下文, 任务结束清空

Tools(工具库):

为智能体配备的工具API, 比如:数据库搜索,代码执行器, 计算器等等。

Action(执行):

最后就是执行,根据规划和记忆进行执行,这个过程中可能调用外部的API.

自己创建一个Agent

其实已经有开源的Agent框架了,比如说LangChain,我们只需要调用接口即可。

添加记忆

添加工具


其他Agent框架

今天的分享就到这里了,有问题可以在评论区留言,均会及时回复呀.

我是bling,未来不会太差,只要我们不要太懒就行, 咱们下期见.

相关推荐
【建模先锋】13 分钟前
精品数据分享 | 锂电池数据集(10)基于阻抗的锂离子电池在不均衡使用情况下的性能预测
人工智能·python·深度学习·锂电池·锂电池寿命预测·锂电池数据集·剩余寿命预测
Trouvaille ~15 分钟前
零基础入门 LangChain 与 LangGraph(五):核心组件上篇——消息、提示词模板、少样本与输出解析
人工智能·算法·langchain·prompt·输入输出·ai应用·langgraph
吃一根烤肠25 分钟前
2026年4月AI大事件深度解读:大模型竞争进入“深水区“
人工智能
小陈工35 分钟前
数据库Operator开发实战:以PostgreSQL为例
开发语言·数据库·人工智能·python·安全·postgresql·开源
慕涯AI37 分钟前
Agent 30 课程开发指南 - 第21课
人工智能·python
源码之家43 分钟前
计算机毕业设计:Python城市天气数据挖掘与预测系统 Flask框架 随机森林 K-Means 可视化 数据分析 大数据 机器学习 深度学习(建议收藏)✅
人工智能·爬虫·python·深度学习·机器学习·数据挖掘·课程设计
数智化管理手记1 小时前
零基础认知精益生产——核心本质与必避误区
大数据·数据库·人工智能·低代码·制造
用户5191495848451 小时前
Kubernetes kubeadm 集群部署与 CKA 实战指南
人工智能·aigc
幻风_huanfeng1 小时前
人工智能之数学基础:坐标下降法
人工智能·深度学习·计算机视觉·梯度下降法·坐标下降法
弋痕1 小时前
Graphiti 实时知识图谱实战笔记
人工智能