文章目录
基础
概述
-
定义
AI Agent(智能体)是一个能够自主感知环境、做出决策、采取行动的程序或系统。
-
执行过程
通过传感器、摄像头等信息采集设备,完成信息获取;利用大语言模型处理采集到信息,做出分析,并给出执行指令;再通过操作设备完成对应指令。
-
功能
创建项目、修复BUG、代码CR、发布上线;
写文档、自动化控制app;
-
特点
自主性(Autonomy):智能体能够在没有人类或其他实体的直接干预下运行,并对其行动和内部状态具有某种程度的控制。
反应性(Reactivity):智能体能够感知其环境,并对环境变化做出实时响应。
交互性/社交性(Socialability):智能体能够与其他智能体或人类进行交互和协作。
适应性/主动性(Proactivity):智能体能够根据环境变化主动调整其行为策略,适应新的情况。
学习能力:许多智能体具有通过经验或数据学习和改进的能力。
-
案例
利用智能体,自动创建Vue3项目
-
智能体技术架构

-
现阶段存在的产品
openai:https://openai.com/index/introducing-deep-research/
智普清言的沉思:https://chatglm.cn/main/alltoolsdetail?lang=zh
manus:https://manus.im/
manus核心是脚本的执行,
-
AI、智能体、模型、大模型之间的区别

最大的模型网站:hugging face
AI是一个学科;模型是一个工具;大模型是一个参数量极大的工具;智能体是AI技术落地的系统级应用,形成感知-决策-执行的闭环;大模型是智能体的大脑中枢。
-
智能体分类
自主智能体(Autonomous Agents)
自主智能体是一种能够在没有人类干预的情况下,自主执行任务、做出决策和与环境互动的智能系统。它们具有高度的自主性,能够独立地感知环境、做出决策并执行行动,而不需要外部的控制和干预。
反应智能体(Reactive Agents)
反应智能体主要关注对环境变化的实时响应。使用简单反射模型,根据当前感知做出决策,而不需要复杂的内部状态或长期规划。
-
智能体发展阶段
第1级:聊天机器人-具有对话语言技能 当前AI类似ChatGPT、豆包
第2级:实用工具-能够执行具体任务 像博士一样解决问题
第3级:专家助手-具有特定领域的专业知识 代替用户采取行动
第4级:团队合作者-能够与人类团队协作
第5级:通用人工智能(AGI)-具有与人类相当或超越人类的通用智能
-
技术架构
单个智能体:大模型+Tools工具
多个智能体的串联:LangGraph,Dify,Coze等平台
智能体的调用:phthon/Node
-
智能体设备架构图

核心:通过大模型LLM调用工具,进而调用Function(函数)、MCP(模型上下文协议)、RAG(检索增强生成)解决问题;
-
智能体开发流程
大模型创建、智能体工具开发、智能体开发、智能体串联、智能体运行

-
思考
案例是vue3项目自动构建,是不是可以整一个创建springboot的基础后端服务?
是不是可以整一个数据库迁移的智能体的脚本呢?