大模型(七)Agent AI学习笔记

前言

李飞飞 Agent AI survey

读这篇文章想弄明白如下问题:

  1. Agent AI的入门门槛,需要具备哪些基础知识
  2. Agent AI能自动化到什么程度,能否完全把一个较为复杂的问题交给 Agent 来解决

Contents

1. Introduction

background

Embodied AI:用 Agent AI 解决实际问题

Interactive Learning:用用户的显式和隐式反馈来迭代大模型

overview

2. Agent AI Integration

Agent AI当前的问题:

  • 幻觉(Hallucinations):pretrain 的语料在某个领域的语料比较少,导致模型在 inference 时出现幻觉。内在幻觉:和源知识相悖;外在幻觉:在源知识的基础上,额外添加一些不正确的信息。可以通过 rag 来缓解幻觉问题。
  • 偏见和包容性:生成的内容有偏且包容性较差,可以通过搜集更多的训练数据以及用户反馈来缓解偏见和包容性的问题。
  • 隐私和安全性:暂时不关注。
  • 可解释性:
    • 从模仿到解耦:模仿一个专家的 policy 很不通用,可以将一个复杂的任务转换成多个简单的子任务,实现一个复杂任务到多个子任务的"解耦"。
    • 从解耦到泛化性:每个子任务都比较简单,生成的 policy 可以做到比较通用,甚至可以 transfer 到其他任务中。
    • 从泛化性到涌现能力:多个泛化的子结构组合在一起,通常能够解决一些更复杂的任务。
  • 增强推理能力:加数据、加 human feedback等等
  • 规范化:prompt engineering

3. Agent AI Paradigm

new paradigm for training Agent AI:

LLM:task planning、reasoning

VLM:visual recognition capability

Agent transformer definition:add agent tokens into transformer model structure, such as controller actions.

过程中目标定义和实时监控非常重要。

4. Agent AI Learning

Reinforcement Learning

reward designing: dedicate design

data collection: more data

long horizon steps: task planing

Imitation Learning

mimic learning

后续

疑问是否得到解答?

  1. Agent AI 的入门门槛
  2. Agent AI 的自动化程度
相关推荐
科技小花15 小时前
全球化深水区,数据治理成为企业出海 “核心竞争力”
大数据·数据库·人工智能·数据治理·数据中台·全球化
zhuiyisuifeng16 小时前
2026前瞻:GPTimage2镜像官网或将颠覆视觉创作
人工智能·gpt
徐健峰17 小时前
GPT-image-2 热门玩法实战(一):AI 看手相 — 一张手掌照片生成专业手相分析图
人工智能·gpt
weixin_3709763517 小时前
AI的终极赛跑:进入AGI,还是泡沫破灭?
大数据·人工智能·agi
Slow菜鸟17 小时前
AI学习篇(五) | awesome-design-md 使用说明
人工智能·学习
ZC跨境爬虫17 小时前
跟着 MDN 学 HTML day_9:(信件语义标记)
前端·css·笔记·ui·html
冬奇Lab17 小时前
RAG 系列(五):Embedding 模型——语义理解的核心
人工智能·llm·aigc
深小乐17 小时前
AI 周刊【2026.04.27-05.03】:Anthropic 9000亿美元估值、英伟达死磕智能体、中央重磅定调AI
人工智能
码点滴17 小时前
什么时候用 DeepSeek V4,而不是 GPT-5/Claude/Gemini?
人工智能·gpt·架构·大模型·deepseek
狐狐生风17 小时前
LangChain 向量存储:Chroma、FAISS
人工智能·python·学习·langchain·faiss·agentai