智能体是一种能够自主行动、感知环境、做出决策并与环境交互的智能应用或实体。
- 特性
- 自主性:智能体能够根据自身的感知和内部状态,独立做出决策,无需人类直接干预。
- 反应性:能对环境的变化做出实时反应,及时调整自身行为以适应环境的动态变化。
- 目的性:具有明确的目标或任务,其行为是为了实现这些目标,会根据目标来规划和执行行动。
- 学习能力:能够从经验中学习,通过处理新信息和积累经验来改进其未来的行为,不断提升自身性能和适应能力。
- 社会性:在某些情况下,智能体需要与其他智能体或人类进行交流与协作,以共同完成复杂的任务。
- 分类
- 简单智能体:通常只有简单的决策规则,例如自动门、温度控制器等,它们根据特定的条件执行相应的简单动作。
- 专家智能体:在特定领域具有专业知识和技能,如医疗诊断系统、股票交易系统等,能够利用其专业知识为特定问题提供解决方案。
- 学习智能体:能够通过学习算法从数据中学习,并不断优化自身行为,以适应不同的环境和任务需求。
- 多智能体系统:由多个智能体组成的系统,这些智能体之间可以进行交互和协作,共同完成一个复杂的任务或实现一个共同的目标。
- 结构
- 感知器(sensor):用于感知环境信息,相当于智能体的 "感觉器官",可以是摄像头、麦克风、温度传感器等,也可以是接收数字信号的接口,用于获取外部环境的各种数据。
- 执行器(actuator):用于作用于环境,是智能体的 "行动器官",如机械臂、扬声器、显示屏等,也可以是用于更新数据库、发送指令等的数字执行器,根据智能体的决策来对环境产生影响。
- 控制器(controller):智能体的核心,负责处理感知信息,做出决策,并指导执行器行动,相当于智能体的 "大脑",实现智能体的决策算法并维护必要的内部状态。
- 记忆(memory):用于存储历史信息,包括过去的感知数据、决策结果、学习到的知识等,支持学习和决策过程,帮助智能体根据以往的经验做出更好的决策。
- 决策模块(decision module):根据感知信息、记忆和目标,运用各种决策理论和算法,如理性决策理论、博弈论、概率决策理论等,做出行动决策。
智能体的应用场景非常广泛,包括机器人技术、游戏人工智能、推荐系统、自动驾驶汽车、智能助手等领域。随着技术的不断发展,智能体在未来社会中将发挥越来越重要的作用,帮助人们更高效地完成各种任务,推动各行业的智能化发展。
1、掌握智能体开发全流程与技术核心,系统学习智能体构建方法、工具链与应用策略,拓展AI在科研与产业中的创新场景。
2、深入理解大语言模型(LLM)底层原理与前沿发展,包括Transformer、GPT-4o多模态架构,同步追踪AI Agent技术的最新动态与行业趋势。
3、精通大语言模型本地化部署与优化,从开源模型选型、私有化部署到RAG、微调、量化技术的实战应用,全面提升模型性能与私有数据安全性。
4、从零构建大语言模型,掌握数据集构建、模型训练、参数调优及性能评估全流程,夯实算法开发与工程实践能力。
第一章、智能体(Agent)入门
1、智能体(Agent)概述(什么是智能体?智能体的类型和应用场景、典型的智能体应用,如:Google Data Science Agent等)
2、智能体(Agent)与大语言模型(LLM)的关系
3、智能体(Agent)的五种能力(记忆、规划、工具、自主决策、推理)
4、多智能体(Multi-Agent)协作
5、智能体(Agent)构建的基本步骤
6、案例
第二章、基于字节Coze 构建智能体(Agent)
1、Coze平台概述
2、 **(实操)**从0到1搭建第一个智能体(Agent)
3、 ( **实操)**智能体(Agent)基础设置(多Agent模式、对话流模式、LLM模型设置、提示词撰写等)
4、 **(实操)**为智能体(Agent)添加技能(插件、工作流、触发器、卡片等)
5、 **(实操)**为智能体(Agent)添加知识(知识库介绍、添加知识库、知识库检索与召回等)
6、 **(实操)**为智能体(Agent)添加记忆(创建和使用变量、数据库、长期记忆的开启、修改和删除等)
7、 **(实操)**提升智能体(Agent)的对话体验(设置开场白、快捷指令等)
8、 **(实操)**智能体(Agent)的预览、调试与发布
9、案例
第三章、基于其他平台构建智能体(Agent)
**1、(实操)**基于百度平台构建智能体
**2、(实操)**基于智谱清言平台构建智能体
**3、(实操)**基于通义千问平台构建智能体
**4、(实操)**基于豆包平台构建智能体
5、案例
第四章、国内外智能体(Agent)经典案例详解
1、斯坦福小镇:生成式智能体(Generative Agents)
2、ByteDance Research推出的论文检索智能体
3、Google Data Science Agent
4、AutoGPT:通过自然语言的需求描述执行自动化任务
5、OpenAI推出的首个智能体(Agent):Operator
6、案例
第五章、大语言模型应用开发框架LangChain入门
1、LangChain平台概述(LangChain框架的核心功能与特点)
**2、(实操)**LangChain安装与使用
**3、(实操)**LangChain的核心组件:Models(模型)、Prompts(提示词)、Indexes(索引)、Chains(链)、Agents(智能体)、Memory(记忆)
4、案例
第六章、基于LangChain的大模型API接入
**1、(实操)**在LangChain 中使用OpenAI大语言模型
**2、(实操)**在LangChain 中使用文心一言大语言模型
**3、(实操)**在LangChain 中使用DeepSeek大语言模型
**4、(实操)**在LangChain 中使用智谱清言大语言模型
**5、(实操)**在LangChain 中使用本地开源大语言模型
6、案例
第七章、基于LangChain的智能体(Agent)开发
1、使用LangChain构建Agent的使用流程
**2、(实操)**LangChain的配置与管理
**3、(实操)**LangChain提示词模板(PromptTemplate)的创建与调用
**4、(实操)**利用LLMRequestsChain类实现从互联网获取信息(查询天气等)
**5、(实操)**LangChain链式请求的创建与调用
**6、(实操)**LangChain让AI记住你说过的话
7、案例
第八章、开源大语言模型及本地部署
1、开源大语言模型简介(开源大语言模型的基本概念、开源大语言模型与闭源大语言模型的对比)
2、(实操)开源大语言模型(Llama3、Mistral、Phi3、Qwen2、DeepSeek等)下载与使用
3、(实操)使用Docker部署开源大语言模型(Docker的基本概念、Docker的核心组件与功能、Docker的安装与配置、在Docker中部署Llama3等开源大语言模型)
4、(实操)使用Open-WebUI构建Web可视化交互(类似ChatGPT)的开源大语言模型对话系统(Open-WebUI的基本概念与功能、Open-WebUI的下载与安装、配置一个用于对话系统的Open-WebUI)
5、案例
第九章、从0到1搭建第一个大语言模型
**1、(实操)**数据集构建(数据集的收集与处理、从互联网上收集文本数据、数据清洗与标注、常用的数据集格式,如:CSV、JSON、TXT等)
**2、(实操)**大语言预训练模型的选择(预训练模型的优势、常见的预训练模型,如:GPT、BERT等、从Hugging Face等平台下载预训练模型)
**3、(实操)**大语言模型的训练(模型训练的基本步骤、训练过程中的监控与调试)
**4、(实操)**大语言模型的优化(常见训练参数,如:学习率、批次大小等、参数调整与优化技巧、优化训练参数以提高模型性能)
**5、(实操)**大语言模型的推理(模型推理与模型训练的区别、提高推理速度的技巧、从输入到输出的完整推理流程)
**6、(实操)**大语言模型的部署与应用(模型部署的基本流程、部署环境的配置与管理)
7、案例
第十章、大语言模型优化
1、检索增强生成(RAG)技术详解(RAG的基本原理、RAG在大语言模型中的作用和优势、RAG的系统架构、RAG检索结果与生成结果相结合的方法、RAG知识库的构建方法)
2、向量数据库简介与向量检索技术详解(使用向量数据库进行快速检索)
3、文本嵌入(Text Embedding)技术概述(常用的文本嵌入模型、使用GPT API)
**4、(实操)**基于RAG的问答系统设计
5、微调(Fine-Tuning)技术详解(微调的基本原理、微调在大语言模型中的作用、准备一个用于微调的数据集、常见的微调方法,如PEFT、LoRA等、不同任务的微调策略、微调过程中的常见问题与解决方案)
**6、(实操)**微调一个预训练的GPT模型
7、量化技术详解(量化的基本概念、量化在模型优化中的重要性、量化的不同方法,如:静态量化、动态量化、混合量化等、量化处理的步骤)
8、案例
在过去几年里,人工智能技术取得了飞跃性进展,特别是大语言模型的崛起,已成为推动各行各业创新与变革的重要力量。大语言模型不仅在自然语言处理领域带来了突破,也为智能体的构建、自动化任务执行等多种应用场景提供了前所未有的可能。随着OpenAI的GPT系列模型的迭代升级,以及Llama、DeepSeek等开源大语言模型的不断涌现,智能体技术的应用已经深入到科研、教育、商业等多个领域,影响深远。