机器学习中的 Agent 是什么?

机器学习中的 Agent 是什么?

引言

博主本人要开一个新坑了,主要分享机器学习相关的内容。本人越来越觉得机器学习将来会是 "传说级别" 的技术,因此,需要------跑步前进!

正文

Agent:在机器学习中其中文应该翻译为智能体,是指一个做决策的实体,它在某个环境中观察(感知)当前的状态,然后根据一个策略做出行动(Action),并从环境中获得反馈(奖励或惩罚),以便改进自己的行为策略。

我们可以简单地将 Agent 理解为 一个不断试错、学习如何在环境中达成目标的"AI 小脑袋"。它就是我们训练的那个"模型",它的目标是学会一套策略:在不同的状态下采取最优的行动。

机器学习的本质就是让机器像新生儿一样随机性地做一些动作,同时我们会根据它做出的随机性动作给予它对应的奖励,这些奖励本质上可以视作一种评价标准,当设定目标场景后,完成目标任务时获得奖励越高的策略就是越好的策略,同时也是我们训练的 Agent 在当前场景下所倾向于使用的策略。

如果大家觉得有用,就点个赞让更多的人看到吧~

相关推荐
AI大模型4 分钟前
无所不能的Embedding(01) - 词向量三巨头之Word2vec模型详解&代码实现
程序员·llm·agent
字节跳动数据平台1 小时前
一客一策:Data Agent 如何重构大模型时代的智能营销?
大数据·agent
GIS工具-gistools20211 小时前
ArcGIS Excalibur 的新功能
人工智能·arcgis
THMAIL1 小时前
深度学习从入门到精通 - 迁移学习实战:用预训练模型解决小样本难题
人工智能·python·深度学习·算法·机器学习·迁移学习
音视频牛哥1 小时前
AI+ 行动意见解读:音视频直播SDK如何加速行业智能化
人工智能·音视频·人工智能+·ai+ 行动意见·rtsp/rtmp 播放器·低空经济视频链路·工业巡检视频传输
roman_日积跬步-终至千里1 小时前
【软件架构设计(19)】软件架构评估二:软件架构分析方法分类、质量属性场景、软件评估方法发展历程
人工智能·分类·数据挖掘
.鱼子酱2 小时前
机器学习 - 使用 ID3 算法从原理到实际举例理解决策树
算法·决策树·机器学习
镭眸2 小时前
因泰立科技:用激光雷达重塑智能工厂物流生态
大数据·人工智能·科技
阿豪Jeremy2 小时前
使用MS-SWIF框架对大模型进行SFT微调
人工智能
慧星云2 小时前
双节模型创作大赛开赛啦:和魔多一起欢庆中秋国庆
人工智能·云计算·aigc