机器学习中的 Agent 是什么?

机器学习中的 Agent 是什么?

引言

博主本人要开一个新坑了,主要分享机器学习相关的内容。本人越来越觉得机器学习将来会是 "传说级别" 的技术,因此,需要------跑步前进!

正文

Agent:在机器学习中其中文应该翻译为智能体,是指一个做决策的实体,它在某个环境中观察(感知)当前的状态,然后根据一个策略做出行动(Action),并从环境中获得反馈(奖励或惩罚),以便改进自己的行为策略。

我们可以简单地将 Agent 理解为 一个不断试错、学习如何在环境中达成目标的"AI 小脑袋"。它就是我们训练的那个"模型",它的目标是学会一套策略:在不同的状态下采取最优的行动。

机器学习的本质就是让机器像新生儿一样随机性地做一些动作,同时我们会根据它做出的随机性动作给予它对应的奖励,这些奖励本质上可以视作一种评价标准,当设定目标场景后,完成目标任务时获得奖励越高的策略就是越好的策略,同时也是我们训练的 Agent 在当前场景下所倾向于使用的策略。

如果大家觉得有用,就点个赞让更多的人看到吧~

相关推荐
风象南6 小时前
普通人用AI加持赚到的第一个100块
人工智能·后端
牛奶6 小时前
2026年大模型怎么选?前端人实用对比
前端·人工智能·ai编程
牛奶6 小时前
前端人为什么要学AI?
前端·人工智能·ai编程
哥布林学者8 小时前
高光谱成像(一)高光谱图像
机器学习·高光谱成像
Kagol9 小时前
🎉OpenTiny NEXT-SDK 重磅发布:四步把你的前端应用变成智能应用!
前端·开源·agent
罗西的思考9 小时前
AI Agent框架探秘:拆解 OpenHands(10)--- Runtime
人工智能·算法·机器学习
冬奇Lab10 小时前
OpenClaw 源码精读(2):Channel & Routing——一条消息如何找到它的 Agent?
人工智能·开源·源码阅读
冬奇Lab10 小时前
一天一个开源项目(第38篇):Claude Code Telegram - 用 Telegram 远程用 Claude Code,随时随地聊项目
人工智能·开源·资讯
李剑一10 小时前
你以为OpenClaw在帮你赚钱?其实它是在赚你的钱
openai·agent
canonical_entropy11 小时前
AI Agent 的演进之路:从对话到自主代理操作系统
低代码·aigc·agent