RAG-大模型课程《李宏毅 2025》作业1笔记

原视频链接:HW1 - Retrieval Augmented Generation with Agentic System_哔哩哔哩_bilibili

1、什么是RAG

2、为什么用RAG

3、什么是agent系统

1、什么是RAG
  • Retrieval - augmented generation (RAG) ·检索增强生成
  • RAG是一种让大语言模型(LLMs)利用外部知识回答查询的方法,在一种简单的RAG实现中,用户的问题会首先被输入到"检索系统"或"已知知识库"中以收集相关信息。
2、为什么要用RAG
  • 可解决大语言模型知识截止(模型预训练的数据有截止时间)
  • 直接训练模型成本高(RAG不需要训练模型)
  • 提升答案可靠性(比如企业内部文库)
3、作业中的agent

大语言模型,作为一个个"角色"配合完成复杂任务的框架

Agent目前没有统一agent定义,可以查看上篇内容

例子:

  • 用户问题:美国独立战争第一枪在哪里打响的?
  • maneger:决定把问题(如果有RAG ,则与RAG信息一起) 传给哪个"分类专家"------从科学、历史、数学中,选择了历史专家。
  • 事实检测:通过网络搜索,检查历史专家答题结果,确认回答正确。

作业代码链接:ML2025 Homework 1 | Kaggle

相关推荐
机器之心23 分钟前
智谱终于发布GLM-4.5技术报告,从预训练到后训练,细节大公开
人工智能·openai
桜吹雪1 小时前
MCP官方文档:架构概述
人工智能·ai编程
算家计算1 小时前
5B 参数,消费级显卡可部署:Wan2.2-TI2V-5B 本地部署教程,9分钟跑出电影级大片!
人工智能·开源·aigc
哪吒编程2 小时前
重磅更新!满血GPT-5上线,全方位提升,很强
gpt·chatgpt·openai
麦兜*2 小时前
内存杀手机器:TensorFlow Lite + Spring Boot移动端模型服务深度优化方案
java·人工智能·spring boot·spring cloud·ai·tensorflow·ai编程
teeeeeeemo2 小时前
Ajax、Axios、Fetch核心区别
开发语言·前端·javascript·笔记·ajax
在钱塘江2 小时前
LangGraph构建Ai智能体-7-智能体人机交互-HITL
人工智能·python
彼方卷不动了3 小时前
【AI 学习】用 Kotlin 开发一个最基础的 MCP Server 并让它与 Cursor 联动
人工智能·kotlin·mcp
说私域3 小时前
基于梅特卡夫定律的开源链动2+1模式AI智能名片S2B2C商城小程序价值重构研究
人工智能·小程序·开源