图解LLM,入门大模型必看

9张图解LLM

✅ 1. Transformer vs. Mixture of Experts

  • Transformer 每个解码器块使用固定的前馈网络;
  • Mixture of Experts (MoE) 通过 Router 动态选择部分专家网络,提升模型容量同时减少计算量。

✅ 2. 5种微调大语言模型(LLM)的方法(LoRA系列)

  • LoRA:冻结原始参数,仅训练低秩矩阵 A 和 B;
  • LoRA-FA:输入侧也加入变换,更灵活;
  • VeRA:参数更少,训练共享向量 + 偏置;
  • Delta-LoRA:每层引入多个 LoRA 分支,增强表达;
  • LoRA+:在 B 矩阵上使用更大学习率,加快收敛。

✅ 3. Traditional RAG vs. Agentic RAG

  • 传统RAG:直接用 query 检索向量库,拼接上下文喂给 LLM;
  • Agentic RAG:引入 Agent,迭代重写问题、判断是否信息不足、是否需要用工具或检索源,流程更智能。

✅ 4. 5种 Agentic AI 设计模式

  1. Reflection:先生成再反思输出,迭代优化;
  2. Tool Use:调用外部工具补充信息;
  3. ReAct:推理 + 动作交替进行;
  4. Planning:先拆解任务,逐步执行;
  5. Multi-agent:多个 Agent 协作解决复杂问题。

✅ 5. 5种 RAG 文本切分策略(Chunking)

  1. Fixed-size:定长切分,简单易实现;
  2. Semantic:按语义相似性拼接;
  3. Recursive:大段内容递归再切分;
  4. 结构化切分:按文档结构如标题、章节切分;
  5. LLM生成切分:利用LLM智能划块。

✅ 6. 5级 Agentic AI 系统能力层级

  1. 基础回复者:只用 LLM 输出结果;
  2. Router 模式:路由器 LLM 选择最佳模型;
  3. 工具调用:LLM 能调用 API、数据库等外部资源;
  4. 多智能体:多个子 Agent 协同;
  5. 自主智能体:生成+验证器 Agent 形成闭环反馈优化。

✅ 7. Traditional RAG vs. HyDE

  • RAG:直接将 query 用作向量检索;
  • HyDE:先让 LLM 生成一段"假设文本",用该文本向量检索,提高相关性。

✅ 8. Traditional RAG vs. Graph RAG

  • RAG:依赖向量库检索相关文档;
  • Graph RAG:用 LLM 生成知识图谱(实体+关系),结合图数据库进行图遍历,获取结构化上下文。

✅ 9. KV Caching in LLMs

  • Insight 1:生成新 token 只需最后的 hidden state;
  • Insight 2:最后 hidden state 只依赖最后一个 query 向量和之前所有的 key/value 向量;
  • 结论:将 K/V 向量缓存起来,可避免重复计算,大幅提升推理效率。
相关推荐
weixin_4624462313 分钟前
【原创实践】开源扣子 coze-studio 安装本地插件配置:接入“今日诗词”API(获取所有古诗词)
开源·开源扣子
探索宇宙真理.1 小时前
WordPress AI Engine信息泄露漏洞 | CVE-2025-11749 复现&研究
人工智能·经验分享·开源·安全漏洞
AI猫站长2 小时前
商汤科技孵化“大晓机器人”,联合创始人王晓刚亲自挂帅,推出开源世界模型3.0与具身超级大脑模组,万亿具身智能赛道再迎重量级玩家,行业竞争格局生变
科技·机器人·开源
zhaodiandiandian2 小时前
从跟跑到领跑 开源AI开启中国时间的产业变革
人工智能·开源
zhangbinu3 小时前
部署开源ERP系统Dolibarr
开源·erp·dolibarr
龙亘川4 小时前
【课程4.2】我的工作台功能设计:待办/预警/任务模块的交互与数据对接
开源·智慧城市·政务·数据架构·开发系统
一起养小猫4 小时前
【贡献经历】从零到贡献者:我的Kurator开源社区参与之旅
分布式·物联网·云原生·开源·华为云·istio·kurator
CoderJia程序员甲8 小时前
GitHub 热榜项目 - 日榜(2025-12-20)
git·ai·开源·llm·github
隐语SecretFlow16 小时前
从“调研”到社区共建:陈天增的隐语开源实践之路
开源
GitCode官方19 小时前
G-Star 精选开源项目推荐|第二期
开源